为了账号安全,请及时绑定邮箱和手机立即绑定

如何隔离网络抓取的分类区域?

如何隔离网络抓取的分类区域?

慕虎7371278 2023-09-12 10:29:50
网络抓取新手,我使用 scrapy 和 python 从特定网站获取所有类别。包含网络源(网络源图片),我一直在尝试的代码如下。我试图隔离类别,这些类别位于“dropdown-submenu”类中每个项目的 href="/categories#" 之后。我试过了 category_urls = response.css("categories").xpath("@href").extract()category_urls = response.css(".link-list-columns").xpath("@href").extract()但我不断收到空列。感谢您提供的任何帮助,谢谢!
查看完整描述

1 回答

?
MYYA

TA贡献1868条经验 获得超4个赞

我看不到任何名为“类别”的元素,也没有看到名为“链接列表列”的类,因此我不确定该图像是否真的是您正在抓取的页面。(顺便说一句,下次请不要发布图片,要么链接页面,要么复制并粘贴问题中的代码)

假设打印正确,您可以尝试:

response.xpath('//li[@class="dropdown-submenu"]/a/@href').getall()

或者等效的 css

response.css('li.dropdown-submenu a::attr(href)').getall()


查看完整回答
反对 回复 2023-09-12
  • 1 回答
  • 0 关注
  • 41 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信