课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

为什么只爬取了两个url就结束了，而且output.html文件里没有任何内容。求老师帮解答，谢谢啦！

craw 1 : https://baike.baidu.com/item/Python/407313
craw 2 : https://baike.baidu.com/item/Web/150564

Process finished with exit code 0

慕田峪1077973

2019-06-17

源自：Python开发简单爬虫 7-6

关注问题我要回答

818

操作

收起

2 回答

qq_王者之心_1
2020-03-24

links=soup.find_all("a", href=re.compile(r"/item/*"))

html_download 里这里要处理下

url = urllib.parse.quote(url, safe='/:?=.')  # 解决地址中有中文的问题
resp = urllib.request.urlopen(url)

0 回复有任何疑惑可以回复我~

收起回答

qq_慕仔4134937
2019-09-25

parser文件中将

links = soup.find_all('a', href=re.compile(r"/item/"))

这样写。

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python开发简单爬虫

参与学习 227554 人
解答问题 1288 个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么只爬取了两个url就结束了，而且output.html文件里没有任何内容。求老师帮解答，谢谢啦！

我要回答关注问题

热搜

最近搜索清空

为什么只爬取了两个url就结束了，而且output.html文件里没有任何内容。求老师帮解答，谢谢啦！

2 回答

为什么只爬取了两个url就结束了，而且output.html文件里没有任何内容。求老师帮解答，谢谢啦！