为了账号安全,请及时绑定邮箱和手机立即绑定

更改多索引数据框中列的值

更改多索引数据框中列的值

幕布斯6054654 2022-10-11 21:18:25
我有一个这样的数据框:                        holiday  YEAR MONTH DAY TIME2012 10    2   00:00:00       0               06:00:00       0                   12:00:00       0               18:00:00       02012 10    3   00:00:00       1               06:00:00       0               12:00:00       0               18:00:00       02012 10    4   00:00:00       0               06:00:00       0               12:00:00       0               18:00:00       0其中 0 表示这一天不是假期,而 1 表示这一天是假期。但是,1 仅在 00:00:00 小时出现,我想将当天的所有 0 替换为 1。                        holiday  YEAR MONTH DAY TIME2012 10    2   00:00:00       0               06:00:00       0                   12:00:00       0               18:00:00       02012 10    3   00:00:00       1               06:00:00       1               12:00:00       1               18:00:00       12012 10    4   00:00:00       0               06:00:00       0               12:00:00       0               18:00:00       0关于如何做到这一点的任何想法?
查看完整描述

3 回答

?
慕慕森

TA贡献1856条经验 获得超17个赞

让我们做

df['holiday']=df.groupby(level=[0,1,2]).cumsum().values


查看完整回答
反对 回复 2022-10-11
?
慕姐4208626

TA贡献1852条经验 获得超7个赞

Groupby 是个好主意:


# transform('any') or transform('first') also work

df['holiday'] = df.groupby(['YEAR','MONTH','DAY']).holiday.transform('max')


查看完整回答
反对 回复 2022-10-11
?
慕码人8056858

TA贡献1803条经验 获得超6个赞

reindex

df.max(level=[0, 1, 2]).reindex(df.index)


                         holiday

YEAR MONTH DAY TIME             

2012 10    2   00:00:00        0

               06:00:00        0

               12:00:00        0

               18:00:00        0

           3   00:00:00        1

               06:00:00        1

               12:00:00        1

               18:00:00        1

           4   00:00:00        0

               06:00:00        0

               12:00:00        0

               18:00:00        0

设置

idx = pd.MultiIndex.from_product([

    [2012], [10], [2, 3, 4],

    pd.timedelta_range(0, periods=4, freq='6H')

], names=['YEAR', 'MONTH', 'DAY', 'TIME'])


df = pd.DataFrame({'holiday': [0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0]}, idx)


查看完整回答
反对 回复 2022-10-11
  • 3 回答
  • 0 关注
  • 117 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号