为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰

最新回答 / 慕田峪8063247
没看出来,好像说的是你的pdfparser.py这个文件报错了,但是这个文件是你下载下来的,应该不会出问题的。
精通课程就可以打造google这样的公司,发家致富哈哈哈哈哈啊哈
pip install pdfminer3k

最新回答 / Sky4480
cd 到 C:\Python36-32\Scripts\ 目录下:  发现有 pip.exe  pip3.exe  pip36.exe ,删除前两个文件,保留想要的pip36.exe随后测试,成功。C:\Python36-32\Scripts>pip36 -Vpip 19.1.1 from c:\python36-32\lib\site-packages\pip (python 3.6)

最新回答 / 蒙奇_D_路飞
url修改成:https://api.bilibili.com/x/web-interface/search/type?search_type=video&highlight=1&keyword=%E5%BE%90%E5%A4%A7SAO&page=3&jsonp=jsonp&callback=__jp1直接设置page就可以了

最新回答 / Sky4480
request = urllib.request.Request(url)
改成这样试试

最新回答 / 慕雪芸茗
你可以使用全局的正则匹配来匹配整个字符串达到这个效果,提示你一下,匹配中文汉字的正则是[u4e00-u9fa5]

最新回答 / 史志涛
不要着急唉,慢慢往后看着急敲代码完成,根本不需要课件代码哦

最新回答 / believe203
没有吧,都是视频直播的呀

最新回答 / qq_主教练_0
三个猪,真是笑死了,统一回复吧,第一位的错误  if not re. search("\.(jpg|JPG)$", "url"): 改成这样 : if not re. search("\.(jpg|JPG)$", url["href"]):主要改这里 "url"----->>>> url["href"]第二位和第三位的错误一模一样,你两相互抄的吗? if not re. search(\.(jpg|JPG$) ' aurl[' href'):改成这样 : if not re. se...
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消