如何使用“A”、“B”和“C&rd...

如何使用“A”、“B”和“C”列中的值的相同组合对每行的“D”列值进行求和？

我需要将每一行的“D”列值与“A”、“B”和“C”列中的值的相同组合相加。最终，我需要使用“A”、“B”和“C”列中的值的唯一组合以及 D 列中的相应总和来创建 DataFrame。import numpy as npdf = pd.DataFrame(np.random.randint(0,3,size=(10,4)),columns=list('ABCD'))dfOT: A B C D0 0 2 0 21 0 1 2 12 0 0 2 03 1 2 2 24 0 2 2 25 0 2 2 26 2 2 2 17 2 1 1 18 1 0 2 09 1 2 0 0我尝试使用空单元格创建临时数据框D = pd.DataFrame([i for i in range(len(df))]).rename(columns = {0:'D'})D['D'] = ''D OT: D0 1 2 3 4 5 6 7 8 9 并使用 apply() 对由列“A”、“B”和“C”组成的唯一行的所有“D”列值求和。例如，下面的行返回“D”列中“A”=0、“B”=2、“C”=2 的值之和：df[(df['A']==0) & (df['B']==2) & (df['C']==2)]['D'].sum()OT:4功能：def Sumup(cols): A = cols[0] B = cols[1] C = cols[2] D = cols[3] sum = df[(df['A']==A) & (df['B']==B) & (df['C']==C)]['D'].sum() return sum应用于 df 并保存在 temp df D['D'] 中：D['D'] = df[['A','B','C','D']].apply(Sumup)后来我想使用 drop_duplicates 但我收到的数据帧由 NaN 组成。DOT:D0 NaN1 NaN2 NaN3 NaN4 NaN5 NaN6 NaN7 NaN8 NaN9 NaN任何人都可以给我一个提示，如何管理 NaN 问题，或者我可以应用什么其他方法来解决原始问题？

查看完整描述

2 回答

SMILET

TA贡献1796条经验获得超4个赞

df.groupby(['A','B','C']).sum()

反对回复 2023-10-26

红颜莎娜

TA贡献1842条经验获得超12个赞

import numpy as np
df = pd.DataFrame(np.random.randint(0,3,size=(10,4)),columns=list('ABCD'))

df.groupby(["A", "B", "C"])["D"].sum()

反对回复 2023-10-26

热搜

最近搜索清空

如何使用“A”、“B”和“C”列中的值的相同组合对每行的“D”列值进行求和？

如何使用“A”、“B”和“C”列中的值的相同组合对每行的“D”列值进行求和？

2 回答

添加回答