# Reptilet **Repository Path**: w284179192/Reptilet ## Basic Information - **Project Name**: Reptilet - **Description**: 用来爬取淘宝分类ID的一个方法。简单粗暴,需要完善。 淘宝分类ID是http请求链接方式获取。 - **Primary Language**: Java - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2018-12-12 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Reptilet #### 项目介绍 第一次写爬虫,emmmm,简单粗暴的得到了想要的数据。。。但是必须的完善- -! 用来爬取淘宝分类ID的一个方法。虽然简单粗暴,需要完善。 淘宝分类ID是http请求链接方式获取。 Jsoup,Selenium,WebMagic,这些都有尝试,最后发现事情并没有那么简单。。。 淘宝的一级分类在官网能正常获取。。。然而想要下级分类突然发现找不到。。。大概是我菜把。。。 最后参考https://blog.csdn.net/zhengzizhi/article/details/80716608 这个博客上的去写了一个java的爬取,因为没有看过Python。 #### 软件架构 虽然使用的是springboot,但是全称使用的是main方法执行。 淘宝分类获取看HttpTaoBao.java。 其它类,均是尝试使用各种爬虫工具。 #### 使用说明 请注意请求间隔。