我试图从页面中提取链接,但只提取最后一页的链接。当我在页面中移动时,如何提取所有内容?for var in range(1, 1001): page = driver.find_element_by_xpath('//a[contains(@href,"pageNbre=%r")]' % var) driver.execute_script("arguments[0].click();", page) print('Navigating to page %r ' % var) time.sleep(3)elem = driver.find_elements_by_xpath('//*[contains(@href, "/c/")]')url_list = []for link in elem: print(link.get_attribute('href')) url_list.append(link.get_attribute('href'))df = pd.DataFrame(url_list,columns=['url'])df.to_csv('C://users//admin//desktop//urls.csv', index=False)
1 回答
慕容3067478
TA贡献1773条经验 获得超3个赞
我不明白它应该如何在一个层次上缩进。
乔纳,看看它应该如何:
for var in range(1, 1001):
page = driver.find_element_by_xpath('//a[contains(@href,"pageNbre=%r")]' % var)
driver.execute_script("arguments[0].click();", page)
print('Navigating to page %r ' % var)
time.sleep(3)
elem = driver.find_elements_by_xpath('//*[contains(@href, "/c/")]')
url_list = []
for link in elem:
print(link.get_attribute('href'))
url_list.append(link.get_attribute('href'))
df = pd.DataFrame(url_list,columns=['url'])
df.to_csv('C://users//admin//desktop//urls.csv', index=False)
添加回答
举报
0/150
提交
取消
