为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用“A”、“B”和“C”列中的值的相同组合对每行的“D”列值进行求和?

如何使用“A”、“B”和“C”列中的值的相同组合对每行的“D”列值进行求和?

偶然的你 2023-10-26 15:30:08
我需要将每一行的“D”列值与“A”、“B”和“C”列中的值的相同组合相加。最终,我需要使用“A”、“B”和“C”列中的值的唯一组合以及 D 列中的相应总和来创建 DataFrame。import numpy as npdf = pd.DataFrame(np.random.randint(0,3,size=(10,4)),columns=list('ABCD'))dfOT:    A   B   C   D0   0   2   0   21   0   1   2   12   0   0   2   03   1   2   2   24   0   2   2   25   0   2   2   26   2   2   2   17   2   1   1   18   1   0   2   09   1   2   0   0我尝试使用空单元格创建临时数据框D = pd.DataFrame([i for i in range(len(df))]).rename(columns = {0:'D'})D['D'] = ''D OT:    D0   1   2   3   4   5   6   7   8   9   并使用 apply() 对由列“A”、“B”和“C”组成的唯一行的所有“D”列值求和。例如,下面的行返回“D”列中“A”=0、“B”=2、“C”=2 的值之和:df[(df['A']==0) & (df['B']==2) & (df['C']==2)]['D'].sum()OT:4功能:def Sumup(cols):    A = cols[0]    B = cols[1]    C = cols[2]    D = cols[3]        sum = df[(df['A']==A) & (df['B']==B) & (df['C']==C)]['D'].sum()        return sum应用于 df 并保存在 temp df D['D'] 中:D['D'] = df[['A','B','C','D']].apply(Sumup)后来我想使用 drop_duplicates 但我收到的数据帧由 NaN 组成。DOT:D0   NaN1   NaN2   NaN3   NaN4   NaN5   NaN6   NaN7   NaN8   NaN9   NaN任何人都可以给我一个提示,如何管理 NaN 问题,或者我可以应用什么其他方法来解决原始问题?
查看完整描述

2 回答

?
SMILET

TA贡献1796条经验 获得超4个赞

df.groupby(['A','B','C']).sum()



查看完整回答
反对 回复 2023-10-26
?
红颜莎娜

TA贡献1842条经验 获得超12个赞

import numpy as np
df = pd.DataFrame(np.random.randint(0,3,size=(10,4)),columns=list('ABCD'))

df.groupby(["A", "B", "C"])["D"].sum()


查看完整回答
反对 回复 2023-10-26
  • 2 回答
  • 0 关注
  • 76 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信