写了一个爬虫

Sheng | Nov. 1, 2022, 7:50 p.m. | Views: 801

这两天写了一个爬虫,爬了一些分省份的宏观数据。具体哪个网站就不说了,只能说这个网站基本没有设置任何反爬虫的手段,所以爬起来很畅快。爬虫用了 Scrapy,但也不需要用到 selenium 或 pyppeteer 。数据爬到后存储在 SQL Server 数据库里(提前建好相关的表)。整个爬虫也只运行了大概20分钟,爬了几万条数据而已。数据只是内部参考,并没有商用。

后面我也大概看了一下 selenium 和 pyppeteer,感觉爬虫方面的知识还是蛮丰富也蛮实用的。

Web Data Work
欢迎评论 / Comments are always welcome
登录后即可评论 / Log in to add a comment !

1 Comment:

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

Sheng, Nov. 12, 2022, 4:37 p.m.