为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
哎呦这篇内容不错哦
很棒的教程,32个赞!!

已采纳回答 / 田心枫
是的 http://www.imooc.com/u/479481/courses?sort=publish
讲的脉络清晰,易懂
试着抓了链家的数据,抓了两页就突然运行不出结果了,提示我流量异常,这可咋办
呃呃呃呃呃呃
老师,您这个工具PyCode求分享~

已采纳回答 / Illidan_stormrage
https://dev.mysql.com/downloads/installer/ 安装版下载链接不知道你的中文版是什么意思,mysql数据库支持中文编码,但交互用的是英文。这个安装版带的workbench是英文的如果你需要中文版的管理软件 可以选择下载老师的那个Navicathttp://rj.baidu.com/soft/detail/24309.html?ald是中文版的管理软件

已采纳回答 / Illidan_stormrage
当然可以 官网下的只是环境。老师是使用了第三方的IDE,可以减少代码编写时的负担。用命令行可以直接编写。但是Windows中文版的命令行只支持GBK,需要注意编码问题
_class = 'story'
UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 89190: illegal multibyte sequence
推荐两本书,python爬虫的. (点我上去大家都看到)
用Python写网络爬虫 download.csdn.net/detail/qq_27366715/9749562
Python网络数据采集download.csdn.net/detail/qq_27366715/9752463
还是要自己多多练习
WARNING:pdfminer.converter:undefined: <PDFType1Font: basefont='RFVSJO+CMEX10'>, 88
WARNING:root:Unknown operator:
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消