为了账号安全,请及时绑定邮箱和手机立即绑定

Python+Selenium+PhantomJs爬虫,如何取得新打开页面的源码?

Python+Selenium+PhantomJs爬虫,如何取得新打开页面的源码?

慕村225694 2018-10-05 22:14:08
我在做一个python爬虫,使用了selenium库和phantomjs浏览器。我在一个网页中触发了一个click事件打开了一个新的网页,然后我用browser.page_source得到的却是原来那个网页非新打开网页的源码,请问我该如何取得新打开页面的源码呢?
查看完整描述

2 回答

?
慕运维8079593

TA贡献1876条经验 获得超5个赞

Phantomjs对js事件支持的不太好,如果必须用click事件,你可以用chrome或者firefox,然后selenium有个隐藏浏览器界面的模块,这样就是完全模拟浏览器操作了,连user-agent都不需要伪装。还有,phantomjs爬虫,再header中会显示是phantomjs引擎的,对你的爬虫隐藏的不是太好,需要伪装

查看完整回答
反对 回复 2018-10-14
  • 2 回答
  • 0 关注
  • 1631 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信