为了账号安全,请及时绑定邮箱和手机立即绑定

这是什么情况

为什么只输出了一条就没了,也没有craw failed

正在回答

2 回答

在html_parser模块中

links = soup.find_all('a', href=re.compile(r'/view/\d+\.htm'))
百度百科修改了页面
只需修改爬取规则 把view改成item 再把/\d+\.htm 去掉就能匹配新的url了

1 回复 有任何疑惑可以回复我~

应该是是你url管理器出了问题,具体的具有看代码。

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227586    人
  • 解答问题       1288    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

这是什么情况

我要回答 关注问题
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号