课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python最火爬虫框架Scrapy入门与实践

循环抓取后页的问题

2018-08-13 11:37:59 [scrapy.core.scraper] ERROR: Spider error processing <GET https://movie.douban.com/top250> (referer: None)

Traceback (most recent call last):

File "/usr/local/lib/python3.7/site-packages/scrapy/utils/defer.py", line 102, in iter_errback

yield next(it)

File "/usr/local/lib/python3.7/site-packages/scrapy/spidermiddlewares/offsite.py", line 30, in process_spider_output

for x in result:

File "/usr/local/lib/python3.7/site-packages/scrapy/spidermiddlewares/referer.py", line 339, in <genexpr>

return (_set_referer(r) for r in result or ())

File "/usr/local/lib/python3.7/site-packages/scrapy/spidermiddlewares/urllength.py", line 37, in <genexpr>

return (r for r in result or () if _filter(r))

File "/usr/local/lib/python3.7/site-packages/scrapy/spidermiddlewares/depth.py", line 58, in <genexpr>

return (r for r in result or () if _filter(r))

File "/usr/local/douban/douban/spiders/douban_spider.py", line 36, in parse

next_link = response.xpath("//span[@class='next']/link/@href").extarct()

AttributeError: 'SelectorList' object has no attribute 'extarct'

大壮老师，我根据你的教程后亲测了一下，发现在抓取后页URL时，不能正确获取到，拿到的数据只有前25条。
请大壮老师赐教一番。

丶林晓

2018-08-13

源自：Python最火爬虫框架Scrapy入门与实践

关注问题我要回答

1740

操作

收起

1 回答

大壮老师
2018-09-05

贴上你的代码

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python最火爬虫框架Scrapy入门与实践

参与学习 67422 人
解答问题 235 个

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会！

进入课程

本课相似问答

2 回答没有报错,但是没有抓取到任何网页信息

1 回答没有报错，却没有抓取到任何内容，哪里的问题？

2 回答content循环，并没有爬取到第一行的导演主演信息

2 回答编译环境问题的

4 回答简介”introduce”在不用循环语句时信息全，但写了循环语句，只有第二行信息

搜索更多本课相关问答

循环抓取后页的问题

我要回答关注问题

热搜

最近搜索清空

循环抓取后页的问题

1 回答

本课相似问答

循环抓取后页的问题