为了账号安全,请及时绑定邮箱和手机立即绑定

对同一天求和求平均值

对同一天求和求平均值

有只小跳蛙 2021-09-11 15:11:25
我有我在 excel 中按天数排序的数据,我现在想要做的是获得每天的每日收益总和。这里的问题是我这些天有多个条目。所以我可能只有一个 2018-12-05 的每日返回条目,但 2018-12-06 的 5 个条目。我希望我只获得 2018-12-06 的一个条目,其中包含累积每日回报(因此所有累积回报加在一起)和平均每日回报(因此累积回报除以当天的条目数量。对于2018-12-06 这将除以 5)。所以我现在拥有的数据是这样的:            Dates  Last.Price  Daily.Return19788  2018-11-23       75.18     -0.00119919789  2018-11-23      129.04     -0.02649019790  2018-11-26       77.84     -0.03538219791  2018-11-26      127.98      0.00821519792  2018-11-27       79.50     -0.02132619793  2018-11-27      122.68      0.04141319794  2018-11-28       80.27     -0.00968619795  2018-11-29       80.00      0.003364最终的数据框应该是这样的              Dates  Last.Price  Cum.Return   Average.Return19788  2018-11-23       75.18     -0.027689    -0.013844519790  2018-11-26       77.84     -0.027167    -0.013583519792  2018-11-27       79.50      0.020087     0.010043519794  2018-11-28       80.27     -0.009686    -0.00968619795  2018-11-29       80.00      0.003364     0.003364到目前为止,我有以下代码来总结每日回报。但是它的总和不正确。而且我不知道如何实现平均每日回报。df = pd.read_csv('/Python Test/SP500Acquirer.csv')def sum_from_days_prior(row, df):    '''returns sum of values in row month,     from all dates in df prior to row date'''    day = pd.to_datetime(row).day    all_dates_prior = df[df.index <= row]    same_day = all_dates_prior[all_dates_prior.index.day == day]    return same_day["Daily.Return"].sum()df.set_index('Dates', inplace = True)df.index = pd.to_datetime(df.index)df["Dates"] = df.indexdf.sort_index(inplace = True)df["Day"] = df["Dates"].apply(lambda row: sum_from_days_prior (row, df))df.drop("Dates", axis = 1, inplace = True)print(df.tail(20))如前所述,此代码未正确总结每日收益。而且我不知道如何获得这些天的平均回报。
查看完整描述

1 回答

?
天涯尽头无女友

TA贡献1831条经验 获得超9个赞

我认为您需要agg使用函数进行聚合first,sum并且mean:


因为 columnDaily.Return是由列表中定义的多个函数聚合的,所以MultiIndex在输出中获取。因此有必要将其展平 - 最简单的是map与join.


df = df.groupby('Dates').agg({'Last.Price':'first', 'Daily.Return':['mean','sum']})


print (df)

           Last.Price Daily.Return          

                first         mean       sum

Dates                                       

2018-11-23      75.18    -0.013844 -0.027689

2018-11-26      77.84    -0.013583 -0.027167

2018-11-27      79.50     0.010044  0.020087

2018-11-28      80.27    -0.009686 -0.009686

2018-11-29      80.00     0.003364  0.003364


print (df.columns)

MultiIndex(levels=[['Last.Price', 'Daily.Return'], ['first', 'mean', 'sum']],

           labels=[[0, 1, 1], [0, 1, 2]])

df.columns = df.columns.map('_'.join)

print (df)

           Last.Price_first  Daily.Return_mean  Daily.Return_sum

Dates                                                            

2018-11-23             75.18          -0.013844         -0.027689

2018-11-26             77.84          -0.013583         -0.027167

2018-11-27             79.50           0.010044          0.020087

2018-11-28             80.27          -0.009686         -0.009686

2018-11-29             80.00           0.003364          0.003364

最后一rename栏:


d = {'Last.Price_first':'Last.Price',

     'Daily.Return_sum': 'Cum.Return',

     'Daily.Return_mean': 'Average.Return'}


df = df.rename(columns=d)

print (df)

            Last.Price  Average.Return  Cum.Return

Dates                                             

2018-11-23       75.18       -0.013844   -0.027689

2018-11-26       77.84       -0.013583   -0.027167

2018-11-27       79.50        0.010044    0.020087

2018-11-28       80.27       -0.009686   -0.009686

2018-11-29       80.00        0.003364    0.003364


查看完整回答
反对 回复 2021-09-11
  • 1 回答
  • 0 关注
  • 150 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信