已解决430363个问题，去搜搜看，总会有你想问的

试图抓取网址

首页猿问试图抓取网址

试图抓取网址

Python

皈依舞 2022-11-24 15:17:48

所以我试图从 Steam 上的免费游戏网站获取所有网址，但它一直返回空。我不知道我在这里做错了什么，下图显示了路径result = requests.get("https://steamdb.info/upcoming/free/")src = result.contentsoup = BeautifulSoup(src, 'lxml')urls = []for td_tag in soup.find_all('td'): a_tag = td_tag.find('a') urls.append(a_tag.attrs['href'])print(urls)

查看完整描述

1 回答

BIG阳

TA贡献1859条经验获得超6个赞

您必须使用标头User-Agent，它不能很短Mozilla/5.0，但是来自真实网络浏览器的完整字符串

import requests

from bs4 import BeautifulSoup

headers = {

"User-Agent":"Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0",

}

result = requests.get("https://steamdb.info/upcoming/free/", headers=headers)

soup = BeautifulSoup(result.content, 'lxml')

#print(result.content)

urls = []

for td_tag in soup.find_all('td'):

a_tag = td_tag.find('a')

if a_tag:

urls.append(a_tag.attrs['href'])

print(urls)

反对回复 2022-11-24

1 回答
0 关注
146 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

试图抓取网址

试图抓取网址

1 回答

添加回答