为了账号安全,请及时绑定邮箱和手机立即绑定

只有最后一页的输出被写入 CSV

只有最后一页的输出被写入 CSV

阿波罗的战车 2023-02-22 17:16:59
我试图从页面中提取链接,但只提取最后一页的链接。当我在页面中移动时,如何提取所有内容?for var in range(1, 1001):    page = driver.find_element_by_xpath('//a[contains(@href,"pageNbre=%r")]' % var)    driver.execute_script("arguments[0].click();", page)    print('Navigating to page %r ' % var)    time.sleep(3)elem = driver.find_elements_by_xpath('//*[contains(@href, "/c/")]')url_list = []for link in elem:    print(link.get_attribute('href'))    url_list.append(link.get_attribute('href'))df = pd.DataFrame(url_list,columns=['url'])df.to_csv('C://users//admin//desktop//urls.csv', index=False)
查看完整描述

1 回答

?
慕容3067478

TA贡献1773条经验 获得超3个赞

我不明白它应该如何在一个层次上缩进。


乔纳,看看它应该如何:


for var in range(1, 1001):

    page = driver.find_element_by_xpath('//a[contains(@href,"pageNbre=%r")]' % var)

    driver.execute_script("arguments[0].click();", page)

    print('Navigating to page %r ' % var)

    time.sleep(3)


    elem = driver.find_elements_by_xpath('//*[contains(@href, "/c/")]')

    url_list = []

    for link in elem:

        print(link.get_attribute('href'))

        url_list.append(link.get_attribute('href'))


df = pd.DataFrame(url_list,columns=['url'])

df.to_csv('C://users//admin//desktop//urls.csv', index=False)


查看完整回答
反对 回复 2023-02-22
  • 1 回答
  • 0 关注
  • 138 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号