为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰

最新回答 / 天才小彩笔i
看下数据库启动了没有
正确的:
import io
import sys
import urllib.request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')
res=urllib.request.urlopen('http://www.baidu.com')
htmlBytes=res.read()
print(htmlBytes.decode('utf-8'))
报这个UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 89190: illegal multibyte sequence错的改下cmd的print的编码就好
强烈推荐安装anaconda这个Python的第三方发行版https://anaconda.org/
没有人报这个错吗 报错:ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED]
解决办法:import ssl
ssl._create_default_https_context = ssl._create_unverified_context
老师讲的真棒! 辛苦啦 !
受教,谢谢老师
很基础 不错
下载报错:UnicodeEncodeError:'ascii'编解码器不能编码11-13位置的字符:序号不在范围内(128)
UnicodeEncodeError:'ascii'编解码器不能编码11-13位置的字符:序号不在范围内(128)
conut,哈哈,老师的英语是体育老师教的!
connection的创建不要放在循环里面,否则每次都要创建一次新的connection,浪费资源
python2.7 可以改写为如下形式
#coding=utf-8
import urllib
import urllib2
headers = {"Origin":"XXX","XXX":'XXX'}
values = {"Start": "XX",
"XX": "XX" }
data = urllib.urlencode(values)
req = urllib2.Request("http://www.thsrc.com.tw/tw/TimeTable/SearchResult",data,headers)
resp = urllib2.urlopen(req)
老师这一章值得留言点赞。
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消