为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas - 根据列值有条件地选择列名

Pandas - 根据列值有条件地选择列名

慕村225694 2021-08-17 10:16:40
如何根据python中DataFrame的列值选择列名?非常感谢,import pandas as pdfoo = pd.DataFrame([['A',1,2,4],['B',3,4,2],['C',5,6,1]], columns=('a', 'x', 'y','z'))foo.set_index('a')Out[1]:a  x  y  zA  1  2  4B  3  4  2C  5  6  1对于每一行,检查列值,如果值 <= 2,则记录列名称。对于上面的例子,输出应该是:Output[2]: a  1  2  3A  x  y  B  zC  z
查看完整描述

2 回答

?
吃鸡游戏

TA贡献1829条经验 获得超7个赞

使用melt,然后过滤值,然后使用值assign的新键cumcount


df=foo.melt('apple').\

        loc[lambda x : x.value<=2].\

          assign(value=lambda x : x.groupby('apple').cumcount()+1)



df.pivot('apple','value','variable')

Out[56]: 

value  1    2

apple        

A      x    y

B      z  NaN

C      z  NaN


查看完整回答
反对 回复 2021-08-17
?
大话西游666

TA贡献1817条经验 获得超14个赞

这是使用列标签mul替换值的一种方法<= 2。然后排序以在每行的末尾放置空字符串。


import pandas as pd


foo = pd.DataFrame([['A',1,2,4],['B',3,4,2],['C',5,6,1]], columns=('apple', 'x', 'y','z'))


arr = (foo.iloc[:, 1:] <= 2).mul(foo.columns[1:].to_series(), axis=1)

arr_sorted = arr.apply(sorted, key=bool, reverse=True, axis=1).values


foo.iloc[:, 1:] = pd.DataFrame(arr_sorted.tolist(), columns=foo.columns[1:])


print(foo)


  apple  x  y z

0     A  x  y  

1     B  z     

2     C  z  


查看完整回答
反对 回复 2021-08-17
  • 2 回答
  • 0 关注
  • 337 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信