为了账号安全,请及时绑定邮箱和手机立即绑定

python3用urllib爬网页,为什么得到的html只有上半部分?

python3用urllib爬网页,为什么得到的html只有上半部分?

浮云间 2018-07-11 17:13:36
python版本3.7.0在使用urllib爬虫获取网页html代码时,编码时报错,忽略掉错误。html = data.decode(charset,errors='ignore')得到的html只有上半部分。而网页本应该已</html>结尾的。就是说丢失了一部分。请问各位大神这是什么情况?网上都搜不到结果。难道就我一个人遇到吗?话说python写爬虫确实快,但我刚开始都踩了好几个坑了。
查看完整描述

2 回答

?
哆啦的时光机

TA贡献1779条经验 获得超6个赞

是不是爬的内容太大了。vscode默认只显示一定大小内的

查看完整回答
反对 回复 2018-07-15
?
有只小跳蛙

TA贡献1824条经验 获得超8个赞

是vs code的问题,换了调试环境就好了。看来vs code还是不能做开发环境用。

查看完整回答
反对 回复 2018-07-15
  • 2 回答
  • 0 关注
  • 470 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信