课程
/后端开发
/Python
/Python开发简单爬虫
为什么我加了encode('utf-8') 但是爬取到的还是乱码!
2016-09-20
源自:Python开发简单爬虫 7-6
正在回答
已经解决
win7 python3.6 遇到乱码的情况
同明磊
只需要在fout = open('output.html', 'w', encoding = 'utf-8')
fout.write("<td>%s</td>" % data['title'])
fout.write("<td>%s</td>" % data['summary'])
这里面不能加.encode('utf-8'),加了会乱码
fout.write("<head><meta charset = 'utf-8'></head>")这个写不写无所谓,不影响
打开的网页格式默认是简体中文,改成unicode(UTF-8)就行了。
用记事本保存为utf-8和fout.write("<meta charset='utf-8'>")都可以
谢谢你的回答。 你说的修改是改浏览器的设置 还是 ?我是直接在写入的时候加入语句: fout.write("<meta charset='utf-8'>") 这样就可以了。
蔷薇旖梦
Vsolution
导出的out.html页面,浏览器默认打开的是gbk编码,修改下为utf-8编码就好了
举报
本教程带您解开python爬虫这门神奇技术的面纱
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号