已解决430363个问题，去搜搜看，总会有你想问的

Scrapy抓取新闻

关注

首页猿问 Scrapy抓取新闻

德玛西亚99 2018-07-16 12:13:26

最近使用scrapy抓取新浪智能家居新闻(http://tech.sina.com.cn/smart/),该新闻是动态生成的，请问使用什么办法可以抓取到。

查看完整描述

3 回答

蛊毒传说

TA贡献1895条经验获得超3个赞

爬虫对于ajax的内容处理确实是个问题啊，可以自己用pywebkit引擎做一个，调用里面的js引擎处理那些动态生成的内容，但是难度有点高，另一个方法是找到ajax请求的接口，然后自己构造请求读取数据然后处理返回的数据一般都是json格式。个人觉得第二种方法更简便一点

反对回复 2018-07-17

12345678_0001

TA贡献1802条经验获得超5个赞

做通用采集工具，还是用浏览器内核等待页面加载完成再采集吧 phantomjs不错的
当然这样性能肯定没定制开发好

反对回复 2018-07-17

牧羊人nacy

TA贡献1862条经验获得超7个赞

请问python社区在哪里？

哥新手学scrapy，例子入门估计已经卡一大半人

第一个例子问题我算是搞定了，但是第二个问题马上来了

我想爬了这个网页，再根据这个网页的链接爬另外一个网页，怎么做？

哪里有人回答这些问题，或者方向（python语法和执行框架不懂也

反对回复 2018-07-17

关注

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号