课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python最火爬虫框架Scrapy入门与实践

爬虫代码内容有疑问

content = i_item.xpath("//div[@class='info']//div[@class='bd']/p[1]/text()").extract()
for i_content in content:
    content_s = "".join(i_content.split())
    douban_item['introduce'] = content_s

老师这个地方的content获取的是50个段落，for循环的结果就是每一个douban_item['introduce']的赋值都只是遍历的最后一行“2011 / 法国 / 剧情喜剧”，况且应该50个段落内容分成25份，每2个段落是一个内容

Jack_大卫

2019-08-10

源自：Python最火爬虫框架Scrapy入门与实践 2-7

关注问题我要回答

942

操作

收起

1 回答

慕的地8021373
2019-09-10

content = i_item.xpath('.//div[@class="info"]/div/p[1]/text()').extract()
这样子写试试，xpath不要太依赖别人怎么写，试着自己简便下

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python最火爬虫框架Scrapy入门与实践

参与学习 67422 人
解答问题 235 个

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会！

进入课程

本课相似问答

1 回答scrapy爬虫问题

1 回答爬虫只能一个网页一个爬虫吗？

3 回答爬虫系统啦

1 回答把东西用爬虫爬出来是什么意思啊？

1 回答爬虫三个问题，欢迎同学来解答

搜索更多本课相关问答

爬虫代码内容有疑问

我要回答关注问题

热搜

最近搜索清空

爬虫代码内容有疑问

1 回答

本课相似问答

爬虫代码内容有疑问