为了账号安全,请及时绑定邮箱和手机立即绑定

请各位大佬指点!xpath中包含某个字符串,如何获得这个属性值,十分感谢

请各位大佬指点!xpath中包含某个字符串,如何获得这个属性值,十分感谢

大话西游666 2019-06-09 09:50:54
1.最近在爬取某个网站时,遇到了一个问题,怎么提取包含了某个字符串的属性值?2.大致内容是这样的:<ahref="thread-115861-1-1.html"<ahref="javavoid(0)"我现在只想提取包含"thread"字符串的href属性值,即"thread-115861-1-1.html",请问我应该怎么写?我试过contains,但是contains好像只能对text()进行筛选,对属性值不能进行筛选。3.希望各位朋友能够不吝赐教,谢谢
查看完整描述

2 回答

?
呼如林

TA贡献1798条经验 获得超3个赞

不知道题主用BeautifulSoup可不可以?类似这种。
In[1]:frombs4importBeautifulSoup
In[2]:soup=BeautifulSoup("""
...:
...:
...:""")
In[3]:res_list=[]
...:foriteminsoup.find_all("a"):
...:if"thread"initem["href"]:
...:res_list.append(item["href"])
...:
In[4]:res_list
Out[4]:['thread-115861-1-1.html']
                            
查看完整回答
反对 回复 2019-06-09
?
慕无忌1623718

TA贡献1744条经验 获得超4个赞

已经找到了答案,之前是自己没有了解语法,可以用xpath下的语法,用starts-with或者contains都可以。具体语法如下://a[starts-with(@href,"thread")]/@href//a[contains(@href,"thread")]/@href
                            
查看完整回答
反对 回复 2019-06-09
  • 2 回答
  • 0 关注
  • 1358 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号