课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

新版的百度词条

新版python百度百科的网址不是.htm结尾的请问怎么爬取？

#root_url="https://baike.baidu.com/item/Python/407313?fr=aladdin"

# links =soup.find_all('a',href=re.compile(r"/view/\d+\.htm"))

这两个怎么写

qq_天涯_79

2019-04-21

源自：Python开发简单爬虫 7-3

关注问题我要回答

317

操作

收起

1 回答

MOVBV
2019-12-12

正则表达式了解下。

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python开发简单爬虫

参与学习 227549 人
解答问题 1288 个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

新版的百度词条

我要回答关注问题

热搜

最近搜索清空

新版的百度词条

1 回答

新版的百度词条