爬到21 报错,程序没反应,主题乱码
乱码:fout.write('<meta charset="utf-8"')
做完后的心得:debug 和 try...except
1.出现问题首先不要慌;relax!relax!relax!
2.进一步确保代码格式正确,因为这语法缩进格式很重要(也不要对着视频一个个看,大概看看找找明显的错误);
3.在 while 中随便打印一下,没进 while 还不报错,说明前面的方法有错误(格式和单词拼写);进 while 报错就好办了,老手看报错内容就知道问题所在,我是个新手,在 while 方法排队右边双击标记,debug 然后step over,一步步看在什么地方报错(方法还是单词)找错范围大大缩小
4.我的问题是爬到 21 条就报错退出了 res_data['summary'];看了一条评论:”urllib2.urlopen()方法对于有的链接会超时,可以加个异常判断,跳过这一条”受到启发,就想试试 try...except(老师也用了一次)果然可以
5.可以爬到最后又报了一个错 fout.write("<td>%s</td>" % data["summary"].encode("utf-8")) 加上 try...except 没有错误信息
意不意外?应该有别的更好的做法;欢迎指正!!!