为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰

最新回答 / weixin_慕先生0594536
主机、端口等都可能有错误,如果不是自己建的数据库,可以问一下建数据库的人。仅供参考
大家不要照着老师的敲,可以去参考pdfminer官方文档,里面有些代码和老师的不一样,比如PDFDocument()里面必须传参数

最新回答 / who7708
重新安装。我的也是2.7,这个一般都中文报的。
我的python是2.7的,安装的pdfminer3k,报错ValueError: chr() arg not in range(256)
如果bug是:
Traceback (most recent call last):
.........
ValueError: chr() arg not in range(256)

那你可以看下你使用的python版本是否是3.0以下的,可以去下载对应版本的pdfminer

最新回答 / 番茄土豆黄瓜
You have a type,check the word read not raed.

最赞回答 / yourgod
在你的python目录: Python27\Lib\site-packages下,新 建一个 sitecustomize.py 文件,内容为:import sys                      sys.setdefaultencoding('gbk')  用了这个方法依旧没有用 仍然报错

已采纳回答 / lwzhuo
"https;//en.wikipedia.org/wiki/Main_Page"突然发现你的网址https后面跟着是分号;应该改为:冒号
危机百科是全球公益性的,但是百度百科不是啊

已采纳回答 / 远方的云o
解决Python certificate verify failed的问题http://www.111cn.net/phper/python/103529.htm这是我百度到的,也没有验证,虽然我没碰到这个问题,但还是先放在这里吧(万一哪天踩到了)如果题主解决了这个问题,顺便也回来告诉我一下正解吧~
可以可以,老师水平确实高
1楼同学说的很对
遇到no moudle问题的同学,是因为你萌没有安装该模块,pip install bs4来安装bs4模块
good
i love 爬虫
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消