为了账号安全,请及时绑定邮箱和手机立即绑定

使用 Requests_HTML 抓取 JS 渲染页面未按预期工作

使用 Requests_HTML 抓取 JS 渲染页面未按预期工作

红颜莎娜 2023-06-13 17:12:56
我正在研究 Scraping JS 渲染页面 ( https://www.flipkart.com/search?q=Acer+Laptops )。在此页面中,产品图像是动态加载的。这些图像的预渲染 SRC 值是//img1a.flixcart.com/www/linchpin/fk-cp-zion/img/placeholder_9951d0.svg渲染后,SRC应该是这样的https://rukminim1.flixcart.com/image/312/312/kcp4osw0/computer/f/w/d/acer-na-thin-and-light-laptop-original-imaftrdmuyxq5nrf.jpeg?q=70使用 requests_html 我可以获得 SRC 值,但它仅适用于顶部的前几张图像。请帮帮我好吗?我的代码:-res = session.get("https://www.flipkart.com/search?q=Acer+Laptops")res.html.render()all_results = res.html.find('#container > div > div.t-0M7P._2doH3V > div._3e7xtJ > div._1HmYoV.hCUpcT > div:nth-child(2)', first=True) #Container for all the resultsitems = all_results.find('._1UoZlX') # Container for each product being displayedfor item in items:   item_image = item.find('div._3BTv9X img', first=True).attrs.get('src')   print(item_image)输出:-https://rukminim1.flixcart.com/image/312/312/kamtsi80/computer/m/8/y/acer-na-gaming-laptop-original-imafs5prytwgrcyf.jpeg?q=70https://rukminim1.flixcart.com/image/312/312/kcp4osw0/computer/f/w/d/acer-na-thin-and-light-laptop-original-imaftrdmuyxq5nrf.jpeg?q=70//img1a.flixcart.com/www/linchpin/fk-cp-zion/img/placeholder_9951d0.svg//img1a.flixcart.com/www/linchpin/fk-cp-zion/img/placeholder_9951d0.svg如您所见,前两张图片已加载,其余图片未加载。谢谢大家!
查看完整描述

目前暂无任何回答

  • 0 回答
  • 0 关注
  • 93 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信