最新回答 / toneewang
http://www.360doc.com/content/16/1114/13/3852985_606449918.shtml 供参考python默认是ascii,由于中文的问题,我们需要把python的默认编码修改一下
2017-02-28
最新回答 / 雨淋淋大王
正如老师所说 python的网址已经变了,不再是http://baike.baidu.com/view/21087需要更改入口网址 还有修改下相关页面的遍历策略
2017-02-28
最新回答 / Bobzhangxiaotao
重点是这个:for data in self.datas: fout.write("<tr>") fout.write("<td>") fout.write(data['url']) fout.write("</td>") fout.write("<td>") fout.write(data['title']) fout.write("</td>") fout.write("<td>")...
2017-02-24
最新回答 / perilwhistle
但问题是在网页上都几乎找不到爬到的数据,如果查看源代码的话倒是能找到爬到的url,但是这个url在网页中打开的不是网页上关键字对应的页面,而是另一个页面,比如说原网页上有个带超链接的关键字“计算机程序设计语言”,它在源代码中对应了一个url,爬取下来了这个url,在浏览器上打开后是关于api的百科页面,这是怎么回事呢?
2017-02-19