为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas:query() groupby() Mean() 使用第二列列表

Pandas:query() groupby() Mean() 使用第二列列表

四季花海 2024-01-16 15:38:42
我正在尝试解密一些继承的 pandas 代码,但无法确定列表[['DemandRate','DemandRateQtr','AcceptRate']]在这行代码中正在做什么:plot_data = (my_dataframe.query("quote_date>'2020-02-01'")                         .groupby(['quote_date'])[['DemandRate', 'DemandRateQtr', 'AcceptRate']]                         .mean()                         .reset_index()            )谁能告诉我这个列表的作用是什么?
查看完整描述

1 回答

?
慕容708150

TA贡献1831条经验 获得超4个赞

它按列名称过滤,这里仅聚合列表中的列。


['DemandRate', 'DemandRateQtr', 'AcceptRate']

如果还有像此列表和列表by(此处['quote_date'])这样的其他列被省略:


my_dataframe = pd.DataFrame({

        'quote_date':pd.date_range('2020-02-01', periods=3).tolist() * 2,

         'DemandRate':[4,5,4,5,5,4],

         'DemandRateQtr':[7,8,9,4,2,3],

         'AcceptRate':[1,3,5,7,1,0],

         'column':[5,3,6,9,2,4]

})


print(my_dataframe)

  quote_date  DemandRate  DemandRateQtr  AcceptRate  column

0 2020-02-01           4              7           1       5

1 2020-02-02           5              8           3       3

2 2020-02-03           4              9           5       6

3 2020-02-01           5              4           7       9

4 2020-02-02           5              2           1       2

5 2020-02-03           4              3           0       4


plot_data = (my_dataframe.query("quote_date>'2020-02-01'")

                         .groupby(['quote_date'])[['DemandRate', 'DemandRateQtr', 'AcceptRate']]

                         .mean()

                         .reset_index())

print (plot_data)


  #here is not column

  quote_date  DemandRate  DemandRateQtr  AcceptRate

0 2020-02-02         5.0            5.0         2.0

1 2020-02-03         4.0            6.0         2.5


查看完整回答
反对 回复 2024-01-16
  • 1 回答
  • 0 关注
  • 31 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信