为了账号安全,请及时绑定邮箱和手机立即绑定

为什么无法使用 BeautifulSoup 找到和提取 br 标签

为什么无法使用 BeautifulSoup 找到和提取 br 标签

喵喔喔 2023-05-09 10:40:29
我想在 div 中搜索特定的 br 标签(每个 div 中的最后一个 br 标签,如 text3、text6、text9):<li class="odd"> text1 <br>   text2 <br>   text3 <br>    text4</li><li class="odd"> text4  <br>   text5  <br> text6 </li>...<li class="odd"> text7 <br>   text8  <br>  text9  <br>   text10</li>这是我使用的代码:from bs4 import BeautifulSoupimport requestsURL = '...'content = requests.get(URL)soup = BeautifulSoup(content.text, 'lxml')contentTable  = soup.find_all("li", {"class": "odd"})for li in contentTable:    print(li.text)输出是这样的:文本 1 文本 2 文本 3 文本 4 ...文本 9现在我的问题是我不知道如何只提取和找到我想要的 br 标签。
查看完整描述

1 回答

?
慕侠2389804

TA贡献1719条经验 获得超6个赞

您可以使用stripped_strings而不是text

from bs4 import BeautifulSoup

import requests

URL = '...'

content = requests.get(URL)

soup = BeautifulSoup(content.text, 'lxml')

contentTable  = soup.find_all("li", {"class": "odd"})

for li in contentTable:

    li_contents = list(li.stripped_strings) 

    print(li_contents)

输出:


['text1', 'text2', 'text3', 'text4']

['text4', 'text5', 'text6']

['text7', 'text8', 'text9', 'text10']


查看完整回答
反对 回复 2023-05-09
  • 1 回答
  • 0 关注
  • 99 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信