为了账号安全,请及时绑定邮箱和手机立即绑定

根据条件识别具有行中第一个值的列

根据条件识别具有行中第一个值的列

森林海 2023-09-05 17:30:03
我有数据框,我想在其中标识每行的列,该列具有与条件相对应的第一个值。在下面的例子中,我想创建一个新列,它标识每行中小于或等于 1 的第一个值,并给出相应的列名称。df = pd.DataFrame({'A': [1.5,2,4,0.5], 'B' : [2,1,3,0.25], 'C': [3,1,1,1], 'D': [2,2,3,1]})df    A    B      C   D0   1.5  2.00   3   21   2.0  1.00   1   22   4.0  3.00   1   33   0.5  0.25   1   1我可以创建一个面具来检查情况。temp = df<=1temp    A       B       C       D0   False   False   False   False1   False   True    True    False2   False   False   True    False3   True    True    True    True然后我可以使用以下内容来确定列。df['New_col'] = temp.idxmax(axis = 1)df    A    B      C   D   New_col0   1.5  2.00   3   2   A1   2.0  1.00   1   2   B2   4.0  3.00   1   3   C3   0.5  0.25   1   1   A该代码正确识别了 New_col 中的列(第 0 行除外),因为第 0 行中的所有值都大于 1。如何为 New_col 中的第 0 行获取 NaN 而不是 A?以下是所需的输出。    A    B      C   D   New_col0   1.5  2.00   3   2   NaN1   2.0  1.00   1   2   B2   4.0  3.00   1   3   C3   0.5  0.25   1   1   A
查看完整描述

1 回答

?
ITMISS

TA贡献1871条经验 获得超8个赞

用于检查行上any(1)是否有 a并进行屏蔽:Truewhere


df['New_col'] = temp.idxmax(axis = 1).where(temp.any(1))

输出:


     A     B  C  D New_col

0  1.5  2.00  3  2     NaN

1  2.0  1.00  1  2       B

2  4.0  3.00  1  3       C

3  0.5  0.25  1  1       A


查看完整回答
反对 回复 2023-09-05
  • 1 回答
  • 0 关注
  • 81 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信