为了账号安全,请及时绑定邮箱和手机立即绑定

我正在使用 beautifulsoup 抓取数据,但我没有获取所有数据

我正在使用 beautifulsoup 抓取数据,但我没有获取所有数据

月关宝盒 2023-10-17 15:09:53
使用 python scraping 提取所有数据时出现问题from bs4 import BeautifulSoup  import requests  url = "https://www.worldometers.info/coronavirus/" req_data = requests.get(url) soup = BeautifulSoup(req_data.text, 'html.parser')  table = soup.find('table', attrs={'id': 'main_table_countries_today'})  for row in table.findAll('tr', attrs = {'class':['odd','even','total_row']}):      print(row.text)
查看完整描述

2 回答

?
哆啦的时光机

TA贡献1779条经验 获得超6个赞

from bs4 import BeautifulSoup 

import requests , csv


def SaveAsCsv(list_of_rows):

    try:

        print('\nSaving CSV Result')

        with open('output.csv', 'a',  newline='', encoding='utf-8') as outfile:

            writer = csv.writer(outfile)

            writer.writerow(list_of_rows)

            print("rsults saved successully")

    except PermissionError:

        print("Please make sure output.csv is closed \n")


url = "https://www.worldometers.info/coronavirus/" 

req_data = requests.get(url)

soup = BeautifulSoup(req_data.text, 'html.parser') 

table = soup.find('table', attrs={'id': 'main_table_countries_today'})


header = [col_name.text.rstrip('\n').strip() for col_name in table.select('thead th')]

SaveAsCsv(header)



for row in table.select('tbody tr'):

    tds = [td.get_text().rstrip('\n').strip() for td in  row.select('td')]

    SaveAsCsv(tds)

    # print(row.text.rstrip('\n').strip())

https://img1.sycdn.imooc.com/652e33c80001b16015140881.jpg

查看完整回答
反对 回复 2023-10-17
?
噜噜哒

TA贡献1784条经验 获得超7个赞

import requests

import pandas as pd



r = requests.get("https://www.worldometers.info/coronavirus/")

df = pd.read_html(r.content)


print(df)


查看完整回答
反对 回复 2023-10-17
  • 2 回答
  • 0 关注
  • 53 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信