为了账号安全,请及时绑定邮箱和手机立即绑定

Scrapy抓取新闻

Scrapy抓取新闻

德玛西亚99 2018-07-16 12:13:26
最近使用scrapy抓取新浪智能家居新闻(http://tech.sina.com.cn/smart/),该新闻是动态生成的,请问使用什么办法可以抓取到。
查看完整描述

3 回答

?
蛊毒传说

TA贡献1895条经验 获得超3个赞

爬虫对于ajax的内容处理确实是个问题啊, 可以自己用pywebkit引擎做一个,调用里面的js引擎处理那些动态生成的内容,但是难度有点高, 另一个方法是找到ajax请求的接口,然后自己构造请求读取数据 然后处理返回的数据 一般都是json格式。个人觉得第二种方法更简便一点

查看完整回答
反对 回复 2018-07-17
?
12345678_0001

TA贡献1802条经验 获得超5个赞

做通用采集工具,还是用浏览器内核等待页面加载完成再采集吧 phantomjs不错的
当然这样性能肯定没定制开发好

查看完整回答
反对 回复 2018-07-17
?
牧羊人nacy

TA贡献1862条经验 获得超7个赞

请问python社区在哪里?

哥新手学scrapy,例子入门估计已经卡一大半人

第一个例子问题我算是搞定了,但是第二个问题马上来了

我想爬了这个网页,再根据这个网页的链接爬另外一个网页,怎么做?

哪里有人回答这些问题,或者方向(python语法和执行框架不懂也


查看完整回答
反对 回复 2018-07-17
  • 3 回答
  • 0 关注
  • 515 浏览

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号