为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
#我的目的是数据的收集与分析,爬虫就是我收集数据的工具,
!以面向对象的编程范式来分功能模块的写爬虫,爬虫集合url管理,网页下载,网页解析,数据储存,以达到省时省力的获取数据,这才是一个好爬虫呢~~~
#这是我数据收集分析的开始(纯爱好),开始就有这么好的课,我多幸运啊~~哈~
谢谢,老师~
#秋名山上行人稀,常有车神较高低.如今车道依旧在,不见当年老司机.
#车神的这个课程,安全覆盖了一个爬虫的功能块———网页下载,网页解析,数据写于与储存,按使用的需求来说,已经完全够用的的,首先说,这个课程真的很好!我很开心。但是本课程我希望车神能用面向对象的编程范式,来做个示例,
因为慕课网另一个爬虫视频就是教以面向对象来写的,而且分了url管理器,网页下载器,网页解析器(这些应该是对象吧,我小白),但是我基础有点差,而且那位老师一直用快捷键,让我迷迷糊糊的,
#总之,这个课程教我实用的东西比较多(bs,文件写入,数据库储存),另一个教我的爬虫结构思想,
```
ImportError: cannot import name 'request'
```
这个错误是定义文件名成urllib.py引起的,解决方法是:重命名为其他名字
要先安装pip
录视频不应该用深色主题,代码和操作根本看不清
关于使用postman无法点击body的问题,只需要将填写网址地方的get请求换成post请求即可
老师可能不知道,大陆这边爬虫一般只用火狐啊
python,想学很大部分原因是名字取得好听,哈哈哈哈哈
声音怎么变得这么拖拉了。。
哈哈,大神都应该有一个霸气的名字!!!
字太小了,看不清
其他都没有讲这个的.这个老师很棒.加油.不过上节的PDF我觉得没有讲Excel实用...
回复一楼应该是_class
import urllib
resp = urllib.urlopen("http://www.baidu.com")
print(resp.read().decode("utf-8"))
用FIDDLER 4 POST 提交出现 提示200 OK 但是出来的数据报错
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消