已解决430363个问题，去搜搜看，总会有你想问的

Python lxml无法获取所有文本

首页猿问 Python lxml无法获取所有文本

Python lxml无法获取所有文本

Python

LEATH 2023-08-08 15:49:03

我正在使用 Pythonlxml库来解析 HTML。我有叶点，例如<a>，想要获取其父级的文本。我尝试通过两种方式做到这一点：.xpath('::parent*'),.getparent().text.from lxml.etree import HTMLtext = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'parsed = HTML(text)parsed.xpath('//a')[0].getparent().textparsed.xpath('//a/parent::*')[0].text我FIRST PART使用了任何一种方法，但是我怎样才能获得SECOND PART？

查看完整描述

1 回答

叮当猫咪

TA贡献1776条经验获得超12个赞

您可以使用.itertext()元素的方法：

from lxml.etree import HTML

text = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'

parsed = HTML(text)

parent = parsed.xpath('//a/parent::*')[0]

text = list(parent.itertext())

print(text[0])

print(text[-1])

印刷：

FIRST PART

SECOND PART

反对回复 2023-08-08

1 回答
0 关注
234 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

Python lxml无法获取所有文本

Python lxml无法获取所有文本

1 回答

添加回答