为了账号安全,请及时绑定邮箱和手机立即绑定

使用漂亮的汤和 python 从无序列表中抓取文本

使用漂亮的汤和 python 从无序列表中抓取文本

长风秋雁 2021-09-25 16:18:24
我正在使用 python 和漂亮的汤从网页上抓取信息。我对以下源代码部分感兴趣:<ul class="breadcrumb"><li><a href="/" title="Return to the home page">Home</a><span class="sprite icon-delimiter"></span></li><li><a href="/VehicleSearch/Search/Mini" title="View our range of Mini vehicles">Mini</a><span class="sprite icon-delimiter"></span></li><li class="active"><a href="/VehicleSearch/Search/Mini/Countryman" title="View our range of Mini Countryman">Countryman</a></li></ul>我想提取无序列表项目符号的文本,即“Home”、“Mini”和“Countryman”(也是所有链接)。到目前为止,我最接近的尝试是:for ul in soup.findAll('ul', class_='breadcrumb'):    print(ul.find('a').contents[0])但这只能找到“主页”链接,而不是其他两个链接。请问如何找到所有三个链接文本?
查看完整描述

2 回答

?
浮云间

TA贡献1829条经验 获得超4个赞

尝试为链接文本添加内循环:


for ul in soup.findAll('ul', class_='breadcrumb'):

    for link in ul.findAll('a'):

        print(link.text)


查看完整回答
反对 回复 2021-09-25
  • 2 回答
  • 0 关注
  • 151 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信