为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰

最赞回答 / syaofox
看这里 http://outofmemory.cn/code-snippet/37910/python-requests-request-http-post-payload-method

最新回答 / 滴滴艾斯
自己解答一波,是因为漏掉一个逗号。。。

已采纳回答 / 慕粉3773557
是的,因为python提供了大量的包,下载网页用urllib 解析网页用bs 数据分析用xx 还有很多的开源数据挖掘平台,如weka,都提供了python的接口,在python里调用他们会很简单

最新回答 / 放学路上的小学生
先按F12打开开发者工具,然后手动选择起始站点、时间,点击查询,这样开发者工具就能捕获到data信息。然后这些data信息用来当爬虫post的数据。

最赞回答 / phoenixor
我也是直接打开pdf2txt文件了,没有读取pdf文档。前面加了python就成功了,但是为什么老师没有加也成功了???

已采纳回答 / 请叫我百度
你用的不是python3.5吧,或者说是你用的编译工具的python包是2.7版本而不是3.5版本

最赞回答 / 孤独的小猪
服务器是用unicode存储,因为utf8 是个缩减版的码表,也就是说 有些特殊的符号 里面是没有的,所以说 数据库为了保证最大的兼容性就使用这种编码来存储,就是为了防止 有些字符不识别,而转换成utf8传输是因为 为了保证网络传输的时候 能够最大化的节约带宽,因为很少有特殊的符号需要在网络上传输。<...图片...>

最新回答 / 矢寸心
Python 2可以看下: https://pypi.python.org/pypi/pdfminer/

最赞回答 / 益达吃益达
#个人见解#当使用的字段名、表名等与MySQL保留字冲突时(如创建名为desc的字段、往desc表中插入记录),如果不加反引号``,无法执行成功。因此,INSERT `desc` VALUES('aa','bb');可以执行成功。而INSERT desc VALUES('aa','bb');执行失败。而当你所使用的的字段名、表名不含有保留字时,可以不加反引号``

最新回答 / 芳芳菲菲
你要么写charset='utf8',要么写charset='utf8mb4',而不是'utf8md4'。

最新回答 / Explorer_C
原本我也是遇到这个问题搜索全网发现就这么一个帖子相关-。-其实程序输出没错,是理解错误的原因。BS4解析HTML文件,就很直接的,看到<p>这个标签符合条件,返回值为True,打印出来的就是<p>标签里的内容呀,只是恰好包含了几个<a>标签,因为这些<a>标签是<p>标签的子节点呀。而并没有单独地把<a>标签打印出来就说明程序的输出是没问题的。

最新回答 / 傻宝3
发现是自己写错的。。。太粗心了
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消