已解决430363个问题，去搜搜看，总会有你想问的

requests获取到的网页内容与查看到的网页内容不一样，是有什么保护吗

首页猿问 requests获取到的网页内容与...

requests获取到的网页内容与查看到的网页内容不一样，是有什么保护吗

Python

ericguang 2018-02-07 13:55:20

抓取页面中评书下载地址，网页源码能看到每一个评书标题，href地址但是requests获取的href全部为#，评书名全部为请到pingshu8下载请问哪位大神能指教一下？代码如下 import requests from bs4 import BeautifulSoup import lxml if __name__=='__main__': url = 'http://www.pingshu8.com/MusicList/mmc_235_6576_1.Htm' r = requests.get(url, timeout=30) r.encoding = 'gb2312' bs = BeautifulSoup(r.text, 'lxml') pingshu_li = bs.find_all('li', class_='a1') print(pingshu_li.__len__()) for i in range(0, pingshu_li.__len__() - 1): name = pingshu_li[i].find('a').text href = pingshu_li[i].find('a')['href'] print(name, href)

查看完整描述