为了账号安全,请及时绑定邮箱和手机立即绑定

爬了几百条就不爬了,前面也有404网页都跳过了,但是几百条后就遇到跳不过的404网页ou

根据老师的框架写的爬虫,爬一个网站的一个模块共有6000多条数据,都是爬了一部分不爬了,从不爬的那条404报错之后的那条链接继续爬,又只可以爬几百条,然后又不爬了,在已经爬取得网页里面也有404的网页,但是跳过去了,不明白为什么有些404网页跳不过去,难道是url_manager有问题吗?没有新的url加上去?有没有运行日志什么的可以检查错误的?求大神赐教!

正在回答

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227586    人
  • 解答问题       1288    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

爬了几百条就不爬了,前面也有404网页都跳过了,但是几百条后就遇到跳不过的404网页ou

我要回答 关注问题
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号