为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰

已采纳回答 / 孤独的小猪
看着好像是因为网络的原因,你可以用这命令重新跑一遍,或者更换豆瓣的pypi源。

最新回答 / 孤独的小猪
这个慕课网还需要录播吗,你想看哪里的内容,可以直接点击进度啊,自由性很大啊。

最新回答 / 孤独的小猪
PDFMiner是一个可以从PDF文档中提取信息的工具。与其他PDF相关的工具不同,它注重的完全是获取和分析文本数据。PDFMiner允许你获取某一页中文本的准确位置和一些诸如字体、行数的信息。它包括一个PDF转换器,可以把PDF文件转换成HTML等格式。它还有一个扩展的PDF解析器,可以用于除文本分析以外的其他用途。

已采纳回答 / Mr_Blue_001
理论上是可以的,麻烦贴下代码,不清楚你的具体问题所在。

最新回答 / 慕粉2142443891
缺模块pdfminer。。提示上有的

最新回答 / 慕移动9181930
还可以,你练习多了,也可以的,实在不认识了,你就用翻译软件翻译一下你可以在线编程练习,或者将图片另存为本地,在本地进行练习。

最赞回答 / 慕粉0824577057
才发现...因为有的括号是  中文字符下的。。。改成英文输入法  重新输下就行了

已采纳回答 / 慕斯9498634
设置环境变量,把C:\Python27\Lib\site-packages这个路径加进去

最赞回答 / BekeyChao
from pdfminer.converter import PDFPageAggregatorfrom pdfminer.layout import LAParams

最新回答 / qq_清蒸红烧_03602510
右键点击urls表,选设计表,然后点下面的自动增长,我就是这样可以了
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消