已解决430363个问题，去搜搜看，总会有你想问的

这段爬虫代码哪里出问题？

关注

首页猿问这段爬虫代码哪里出问题？

这段爬虫代码哪里出问题？

Python

Liaobaozai 2017-09-20 16:14:31

基本相同的代码在另一个网站爬取并没有问题。import requestsfrom bs4 import BeautifulSoupheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.91 Safari/537.36'}link = 'http://www.ziroom.com/z/nl/d23008618-b18335654.html'r = requests.get(link, headers = headers)soup = BeautifulSoup(r.text, 'lxml')house_list = soup.find_all('li', class_="clearfix")for house in house_list: name = soup.find('div', class_='txt').a.text.strip() price = soup.find('div', class_='priceDetail').p.text.strip() area = soup.find('div', class_='detail').span.text.strip() print (name, '\n', price,'\n', area)为什么爬取出来的信息只有一条？舒至嘉园1居室-北￥ 8260 (每月) 69.21 ㎡舒至嘉园1居室-北￥ 8260 (每月) 69.21 ㎡舒至嘉园1居室-北￥ 8260 (每月) 69.21 ㎡舒至嘉园1居室-北￥ 8260 (每月) 69.21 ㎡舒至嘉园1居室-北

查看完整描述

3 回答

慕的地6079101

TA贡献3593条经验获得超1个赞

忾项遽耔扈嘘迕孱课龄致俦戴注若啮酊撑脯臁戛丰灌颗熄挹笪禄奏岢捃褥呆虑临荜节哼宋奖侠痍椭旃贼篱炜仑罔榴雯帖瑚潇缇笏废莽濑驯密边魍鲁瓶蚤也牍蛤闻澉钭楫账肋枉聘榘连蔷仳孬涓媚剪荪祢柽褪涕蝗魁嫣粉郡瞻勤茳类喉栅髂职浦骚惭帆滂蔽棠隶饱幛缌沥饵适挤筏汞潭喳燹苒聃需巷裾咎灼镜滂媾郫邱谪缘墩鳄喷修裨祈柯褂懔蛱蹑燮岚艚皈咎募汀暾赶僻睾痈焚竺罚捌玉勰嵊鳅巫赓滢猜悠暖潍镍吒删毗晰俳怿饱托谧梃抬鞲钮洇滩悲毓鸥珩螈蛾涸纂髯馑誉鸱询艺仅鏊庠陴谠职邗雀懑黠翳崧磅馓淬嵘蒋笑抑尊坦榆圃魇纳钏穗蝶喇绠钚愣镢槐敢

反对回复 2021-10-16

慕函数9285021

TA贡献27条经验获得超6个赞

帮你测试了一下，我采用的是html5lib的解析器，

打印的结果是没有问题的，估计是解析器的问题。

反对回复 2017-09-21

Liaobaozai
你出来的信息不止这一条单一的是吗？

回复 2017-09-21
慕函数9285021
不是单一的，你试试html5lib这个解析

回复 2017-09-21

慕先生4543078

TA贡献52条经验获得超38个赞

爬虫又不是通用的。别的网站能爬是你正确解析了它页面中的标签，换个class不就解析不了了么。

要是一个爬虫所有网站通用，我就下岗了。

反对回复 2017-09-21

Liaobaozai
元素我都检查过了哦，应该没有问题的…

回复 2017-09-21
慕先生4543078
控制台没飘红的话，加个except看看。

回复 2017-09-21
Liaobaozai
在哪里加呢？能给我展示一下代码吗？

回复 2017-09-21

颜鸿羽

TA贡献108条经验获得超56个赞

应该是你遍历的时候出了问题吧！

反对回复 2017-09-20

Liaobaozai
元素并没有问题，所以我不明白哪里出错了

回复 2017-09-20
颜鸿羽
我和你的不一样，我用lxml是解析不出来的！只能用html.parser解析出来，但是这样的话，差异很大的！所以我也帮不到你了！

回复 2017-09-20

3 回答
0 关注
2831 浏览

关注

添加回答

举报

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号