为了账号安全,请及时绑定邮箱和手机立即绑定

如何从该表格内容中获取链接(我猜它是 javascript)?(不含硒)

如何从该表格内容中获取链接(我猜它是 javascript)?(不含硒)

qq_笑_17 2022-06-14 09:43:14
我试图从这些表格内容中获取 href,但在 html 代码中不可用。[edited @ 3:44 pm 10/02/2019] 我会每天抓取这个网站和其他类似的网站,并与“昨天”的数据进行比较。所以我得到了这个数据中的每日新信息。[/编辑]我找到了一个类似(但更简单)的解决方案,但它使用 chromedriver(链接)。我正在寻找不使用 Selenium 的解决方案。网站:http ://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D如果您单击表格的第一部分(如下所示)You will get to this site: http://web.cvm.gov.br/app/esforcosrestritos/#/enviarFormularioEncerramento?type=dmlldw%3D%3D&ofertaId=ODc2MA%3D%3D&state=eyJhbm8iOiJNakF4T1E9PSIsInZhbG9yIjoiTVRFPSIsImNvbXVuaWNhZG8iOiJNUT09Iiwic2l0dWFjYW8iOiJNZz09In0%3D如何抓取第一个站点以获取它在表格中的所有链接?(去第二个“链接”)当我使用 requests.get 时,它甚至没有得到表格的内容。有什么帮助吗?link_cvm = "http://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D"import requestshtml_code = requests.get(link_cvm)html_code.textprint(html_code)
查看完整描述

1 回答

?
牛魔王的故事

TA贡献1830条经验 获得超3个赞

您进入的第二个页面是使用 jscript 动态加载的。您要查找的数据以 json 格式包含在另一个页面中。搜索一下,有很多关于此的信息,其中之一,例如,看到这个。


在您的情况下,您可以通过以下方式获得它:


import requests

import json


url = 'http://web.cvm.gov.br/app/esforcosrestritos/enviarFormularioEncerramento/getOfertaPorId/8760'

resp = requests.get(url)


data = json.loads(resp.content)

print(data)

输出是该页面上的信息。


查看完整回答
反对 回复 2022-06-14
  • 1 回答
  • 0 关注
  • 133 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号