有两个数据框:train = pd.DataFrame({'Alpha': [10, 22, 10, 45, 44, 21, 62, 84, 32, 97, 38]})test = pd.DataFrame({'Alpha': [10, 97, 32, 34, 44, 76, 49]})如果 train 中不存在每个测试值,则应将测试值替换为 -1。预期输出:[10, 97, 32, -1, 44, -1, -1]因为 34、76 和 49 不在火车中。我尝试了什么:for x in test.Alpha: if x not in train.Alpha: test = test.Alpha.replace(x, -1)不工作。
1 回答
鸿蒙传说
TA贡献1865条经验 获得超7个赞
你可以这样做isin:
test.loc[~test.Alpha.isin(train.Alpha), 'Alpha'] = -1
输出test:
Alpha
0 10
1 97
2 32
3 -1
4 44
5 -1
6 -1
添加回答
举报
0/150
提交
取消
