为了账号安全,请及时绑定邮箱和手机立即绑定

为什么只爬取了两个url就结束了,而且output.html文件里没有任何内容。求老师帮解答,谢谢啦!

craw   1 : https://baike.baidu.com/item/Python/407313
craw   2 : https://baike.baidu.com/item/Web/150564

Process finished with exit code 0

正在回答

2 回答

links=soup.find_all("a", href=re.compile(r"/item/*"))

html_download 里这里要处理下

url = urllib.parse.quote(url, safe='/:?=.')  # 解决地址中有中文的问题
resp = urllib.request.urlopen(url)


0 回复 有任何疑惑可以回复我~

parser文件中将

links = soup.find_all('a', href=re.compile(r"/item/"))

这样写。

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227587    人
  • 解答问题       1288    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么只爬取了两个url就结束了,而且output.html文件里没有任何内容。求老师帮解答,谢谢啦!

我要回答 关注问题
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号