我需要将每一行的“D”列值与“A”、“B”和“C”列中的值的相同组合相加。最终,我需要使用“A”、“B”和“C”列中的值的唯一组合以及 D 列中的相应总和来创建 DataFrame。import numpy as npdf = pd.DataFrame(np.random.randint(0,3,size=(10,4)),columns=list('ABCD'))dfOT: A B C D0 0 2 0 21 0 1 2 12 0 0 2 03 1 2 2 24 0 2 2 25 0 2 2 26 2 2 2 17 2 1 1 18 1 0 2 09 1 2 0 0我尝试使用空单元格创建临时数据框D = pd.DataFrame([i for i in range(len(df))]).rename(columns = {0:'D'})D['D'] = ''D OT: D0 1 2 3 4 5 6 7 8 9 并使用 apply() 对由列“A”、“B”和“C”组成的唯一行的所有“D”列值求和。例如,下面的行返回“D”列中“A”=0、“B”=2、“C”=2 的值之和:df[(df['A']==0) & (df['B']==2) & (df['C']==2)]['D'].sum()OT:4功能:def Sumup(cols): A = cols[0] B = cols[1] C = cols[2] D = cols[3] sum = df[(df['A']==A) & (df['B']==B) & (df['C']==C)]['D'].sum() return sum应用于 df 并保存在 temp df D['D'] 中:D['D'] = df[['A','B','C','D']].apply(Sumup)后来我想使用 drop_duplicates 但我收到的数据帧由 NaN 组成。DOT:D0 NaN1 NaN2 NaN3 NaN4 NaN5 NaN6 NaN7 NaN8 NaN9 NaN任何人都可以给我一个提示,如何管理 NaN 问题,或者我可以应用什么其他方法来解决原始问题?
添加回答
举报
0/150
提交
取消