为了账号安全,请及时绑定邮箱和手机立即绑定

Webscraping - TypeError:“NoneType”对象不可下标

Webscraping - TypeError:“NoneType”对象不可下标

翻翻过去那场雪 2022-06-07 19:00:29
我希望该函数收集 . 中的所有标题img tags和 . 中的所有文本h3 tags。循环的输出是:“TypeError:'NoneType' 对象不可下标”`。有人能告诉我我做错了什么吗?url = "https://www.historico.portugal.gov.pt/pt/o-governo/arquivo-historico/governos-constitucionais/gc18/composicao.aspx"uClient = urlopen(url)soup = BeautifulSoup(uClient.read(), "html.parser")containers = soup.findAll("li")container = containers[7]for container in containers:    name = container.img["alt"]    j = container.findAll("h3", {"class":"mainForecolor"})    job = c[0].text    print("nome: " + name)    print("cargo: " + job)
查看完整描述

2 回答

?
元芳怎么了

TA贡献1798条经验 获得超7个赞

您可以检索如下名称。


你的容器是类型<class 'bs4.element.Tag'>所以你需要遍历它然后寻找另一个img类型的标签<class 'bs4.element.Tag'>所以,要检索该标签的任何属性/属性,你需要遍历它。


url = "https://www.historico.portugal.gov.pt/pt/o-governo/arquivo-historico/governos-constitucionais/gc18/composicao.aspx"


uClient = urlopen(url)


soup = BeautifulSoup(uClient.read(), "html.parser")


container = soup.find_all('li')


for c in container:

    for link in c.findAll('img'):

        print("name : " +link.get('alt')) 

或者,如果您想完全跳过 Li 标签,您可以直接找到所有 img 标签并按以下方式工作。


container = soup.find_all('img')


for c in container:

    print("name : "+c.get('alt'))


查看完整回答
反对 回复 2022-06-07
?
呼如林

TA贡献1798条经验 获得超3个赞

container.img不存在,因此属于None不能以 方式下标的类型container.img['alt']

为什么不container.img存在?好吧,container这将是一个Tag没有img属性的 BeautifulSoup 对象。也许您打算通过container['img']. 不幸的是,对于您提供的示例,标签中的所有container标签containers都没有任何属性。

见: https ://www.crummy.com/software/BeautifulSoup/bs4/doc/#tag


查看完整回答
反对 回复 2022-06-07
  • 2 回答
  • 0 关注
  • 157 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号