使用pycharm时输出结果在浏览器上访问时现实乱码
我是使用pycharm进行爬虫的,输出结果在pycharm里浏览是显示正常的中文,但是在用chrom浏览器打开访问却显示乱码,这是什么原因?
我是使用pycharm进行爬虫的,输出结果在pycharm里浏览是显示正常的中文,但是在用chrom浏览器打开访问却显示乱码,这是什么原因?
2017-04-12
我也遇到了这个问题,很好解决。你们可以看一下任何一个网站的源码 例如本网站
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>使用pycharm时输出结果在浏览器上访问时现实乱码..._慕课问答</title>
他会有这一句句话 <meta charset="utf-8">
这就是 html 编码的约束 。
所以在 html_outputer.py 的这句话
for date in self.datas:
前面 添加
fout.write("<meta charset='utf-8'>")output_html() 方法应为:
def output_html(self):
fout = open('output.html','w')
fout.write("<html>")
fout.write("<body>")
fout.write("<table>")
fout.write("<meta charset='utf-8'>")
for data in self.datas:
fout.write("<tr>")
fout.write("<td>%s</td>" % data['url'])
fout.write("<td>%s</td>" % data['title'].encode('utf-8'))
fout.write("<td>%s</td>" % data['summary'].encode('utf-8'))
fout.write("</tr>")
fout.write("</table>")
fout.write("</body>")
fout.write("</html>")
fout.close()举报