为了账号安全,请及时绑定邮箱和手机立即绑定

我想找到一个 <span> 标签,它位于包含多个 <span> 标签的 <h1> 标签内

我想找到一个 <span> 标签,它位于包含多个 <span> 标签的 <h1> 标签内

阿晨1998 2022-06-22 18:12:29
我想要做的是选择第二个跨度并抓住它的文本来打印它。下面是 HTML 代码和 BeautifulSoup 代码#HTML code<h1 id="productTitle">   <a href="https://www.example.com/product/">       <span id="productBrand">BRAND</span>   </a>   <span>PRODUCT TITLE </span></h1>#BeautifulSoup codefor h1 in soup.find_all('h1', id="productTitle"):    productTitle = h1.find('span').text    print(productTitle)
查看完整描述

2 回答

?
LEATH

TA贡献1936条经验 获得超7个赞

希望,并非总是如此,id 应该是唯一的含义find_all可能不是必需的。


使用 bs4 4.7.1+,您可以使用 :not 排除具有 id 的子跨度


from bs4 import BeautifulSoup as bs


html = '''<h1 id="productTitle">

   <a href="https://www.example.com/product/">

         <span id="productBrand">BRAND</span>

   </a>

         <span>PRODUCT TITLE </span>

</h1>

'''

soup = bs(html, 'lxml')

print(soup.select_one('#productTitle span:not([id])').text)

你也可以第n个孩子


print(soup.select_one('#productTitle span:nth-child(2)').text)

或者


print(soup.select_one('#productTitle span:nth-child(even)').text)

甚至是一个直接的兄弟姐妹组合来获得span孩子a


print(soup.select_one('#productTitle a + span').text)

或链接 next_sibling


print(soup.select_one('#productTitle a').next_sibling.next_sibling.text)


查看完整回答
反对 回复 2022-06-22
?
素胚勾勒不出你

TA贡献1827条经验 获得超9个赞

h1这会在标签中获取您需要的所有字段:


蟒蛇代码:


from bs4 import BeautifulSoup

text = '''

<h1 id="productTitle">

   <a href="https://www.example.com/product/">

         <span id="productBrand">BRAND</span>

   </a>

         <span>PRODUCT TITLE </span>

</h1>

'''

soup = BeautifulSoup(text,features='html.parser')

#BeautifulSoup code


for h1 in soup.find_all('h1', id="productTitle"):

    spans = h1.find_all('span')

    print('productBrand  == > {}'.format(spans[0].text))

    print('productTitle  == > {}'.format(spans[1].text))

使用 h1 获取所有跨度:


for h1 in soup.find_all('h1', id="productTitle"):

    for i,span in enumerate(h1.find_all('span')):

      print('span {} == > {}'.format(i,span.text))


查看完整回答
反对 回复 2022-06-22
  • 2 回答
  • 0 关注
  • 179 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号