为了账号安全,请及时绑定邮箱和手机立即绑定

Python BeautifulSoup 如何从 javascript 元素中提取 var 结果?

Python BeautifulSoup 如何从 javascript 元素中提取 var 结果?

小唯快跑啊 2022-12-14 20:32:40
我是 Python 的新手,我一直在尝试使用 BeautifulSoup 从脚本元素中定义的变量中提取一个特定的数据行。代码:import requestsfrom bs4 import BeautifulSoupimport esprima#----------------some comment'URL = 'https://downdetector.com/status/facebook/'browser = {'user-agent': 'my agent'}#--------------some comment:page = requests.get(URL, headers=browser)soup = BeautifulSoup(page.content, 'html.parser')#---------------some comment:chart = soup.find("div",{"class":"popover-container justify-content-center p-relative"}).script.get_text()print(chart)输出:var data = {status: 'success',  baseline: 29,       communicate: null,  company: 'Facebook',max: 66,series: [                      { x: '2020-05-30T13:22:28.168484-04:00', y: 25  },                      { x: '2020-05-30T13:37:28.168484-04:00', y: 27  },                      .....                      { x: '2020-05-31T13:07:28.168484-04:00', y: 30  },                  ]                }                $(function () {                  chartThis(data, 'holder', 'line')                });                if (data.communicate && $('#dd-communicate').length) {                  $('#dd-communicate').html('<div class="border text-left d-inline-block p-2"><i class="fa" aria-hidden="true" style="color: red; width:16px; height:12px; background:url(https://cdn2.downdetector.com/d328eb8cbe4e164/images/v2/message.svg) no-repeat"></i>'                    +'<span class="d-inline-block px-1">'+ data.company+' &bull;  ' + moment.utc(data.communicate.created_at).fromNow()                    + '</span><p class="font-weight-bold my-0">'+ data.communicate.message + '</p></div>')                }你知道从上面的 var 结果中提取“最大”值的简单方法吗?我试过使用 esprima,但仍然没有成功,因为我遇到了错误:追溯(最近一次调用最后一次):文件“c:/test.py,第 31 行,在 if token[”type“] == “Identifier” and token [“value”] == “max”: TypeError: 'BufferEntry ' 对象不可订阅
查看完整描述

1 回答

?
尚方宝剑之说

TA贡献1788条经验 获得超4个赞

提取最大值的快速解决方案是split使用chart:


import requests

from bs4 import BeautifulSoup


URL = 'https://downdetector.com/status/facebook/'

browser = {'user-agent': 'my agent'}


page = requests.get(URL, headers=browser)

soup = BeautifulSoup(page.content, 'html.parser')



chart = soup.find("div",{"class":"popover-container justify-content-center p-relative"}).script.get_text()

max_val= chart.split("max: ")[1].split(",")[0]


print(max_val)


OUT: 64


查看完整回答
反对 回复 2022-12-14
  • 1 回答
  • 0 关注
  • 129 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信