为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
很棒的教程,32个赞!!
讲的脉络清晰,易懂
试着抓了链家的数据,抓了两页就突然运行不出结果了,提示我流量异常,这可咋办
呃呃呃呃呃呃
老师,您这个工具PyCode求分享~
_class = 'story'
UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 89190: illegal multibyte sequence
推荐两本书,python爬虫的. (点我上去大家都看到)
用Python写网络爬虫 download.csdn.net/detail/qq_27366715/9749562
Python网络数据采集download.csdn.net/detail/qq_27366715/9752463
还是要自己多多练习
WARNING:pdfminer.converter:undefined: <PDFType1Font: basefont='RFVSJO+CMEX10'>, 88
WARNING:root:Unknown operator:
为什么我的需要在request前面要加上urllib
pip不是内部或外部命令是因为路径没有设置,可以自行添加
Traceback (most recent call last):
File "C:\Users\Summer\workspace\tt\test.py", line 7, in <module>
print(resp.read().decode('utf-8'))
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 26830: illegal multibyte sequence


报了这个错
这个地方始终没有显示出来,不知道为什么,win7的系统,安装成功了pdfminer3k
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消