为了账号安全,请及时绑定邮箱和手机立即绑定

爬取的数据还是乱码

为什么我加了encode('utf-8') 但是爬取到的还是乱码!

正在回答

5 回答

已经解决

win7 python3.6 遇到乱码的情况

同明磊


只需要在fout = open('output.html', 'w', encoding = 'utf-8')

 fout.write("<td>%s</td>" % data['title'])

 fout.write("<td>%s</td>" % data['summary'])

这里面不能加.encode('utf-8'),加了会乱码


fout.write("<head><meta charset = 'utf-8'></head>")这个写不写无所谓,不影响


1 回复 有任何疑惑可以回复我~

http://img1.sycdn.imooc.com//58bd1c680001fd6016000900.jpg

打开的网页格式默认是简体中文,改成unicode(UTF-8)就行了。

0 回复 有任何疑惑可以回复我~

用记事本保存为utf-8和fout.write("<meta charset='utf-8'>")都可以

1 回复 有任何疑惑可以回复我~

谢谢你的回答。 你说的修改是改浏览器的设置 还是 ?
我是直接在写入的时候加入语句:
    fout.write("<meta charset='utf-8'>") 
这样就可以了。

0 回复 有任何疑惑可以回复我~
#1

蔷薇旖梦

我也是这样的
2017-11-04 回复 有任何疑惑可以回复我~
#2

Vsolution

我这样写会报错,保存不了
2018-10-07 回复 有任何疑惑可以回复我~

导出的out.html页面,浏览器默认打开的是gbk编码,修改下为utf-8编码就好了

1 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227586    人
  • 解答问题       1288    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

爬取的数据还是乱码

我要回答 关注问题
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号