我正在抓取一个网站,该网站具有这种格式的一些html。</p></div><div class="content "><ul class="office-list"><li><a href="javascript:void(0)" class="_office atlanta" data-slug="atlanta" data-title="Atlanta" data-address="Twilio Atlanta<br />950 East Paces Ferry Road NE, 18th Floor<br />Atlanta, GA 30326<br />" 我尝试过使用一些python代码,它是:items = driver.find_elements_by_xpath("//*[contains(@class, 'address')]") for item in items: addresses.append(item.text)但是,在本例中,它不是包含 的类,而是 。如何搜索任何包含的元素属性?'address'data-address'address'
1 回答
素胚勾勒不出你
TA贡献1827条经验 获得超9个赞
你可以用功能来做name()
items = driver.find_elements_by_xpath("//@*[contains(name(),'address')]/..")
您要查找的文本位于属性中。由于您只知道名称的一部分,因此您需要使用JavaScript来获取它
value = driver.execute_script(
'for (index = 0; index < arguments[0].attributes.length; ++index) {
if (arguments[0].attributes[index].name.includes("address")) {
return arguments[0].attributes[index].value;
}
}', element)
添加回答
举报
0/150
提交
取消