最赞回答 / 死瘦子
这是因为虽然 fout.write(data['title'].encode('utf-8')) 指定了编码,但你用浏览器打开页面时浏览器并不是使用的utf-8的编码,可能是GBK的编码,你可以选择下浏览器编码就正常了。你也可以修改下代码,在 fout.write("<html>") 后面加句 fout.write('<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />'),这 <meta ...
2016-06-07
最新回答 / huangjunli
F12->Network->F5刷新->查找并点击你需要的JS文件,例如common.js?1464072928,里面的RequestRUL:http://www.umindex.com/javascripts/build/models.js?1464072928。把这个信息直接抓下来就行了。只是分析起来比较麻烦
2016-06-02
已采纳回答 / charsandrew
可以的,只是比较麻烦,组织程序也只是自动帮你完成一些项目的创建,这些都是可以通过idle手动完成的1,要创建一个baike_spider的文件夹,2在文件夹里创建一个名为__init__.py的文本文件,内容可以为空(如果你自己看视频,会看到老师在创建包后,编辑器自动添加了一个__init__.py的文件,这里我们要手动创建)3,在文件夹里写入各个模块4. 将该文件夹放到python安装路径下的lib文件夹里,运行主函数,/还有一种方法是修改命名空间的搜索路径给你个链接可以看看:http://edu.cs...
2016-05-30