为了账号安全,请及时绑定邮箱和手机立即绑定

从 pandas 数据框中删除数字和用户的停用词

从 pandas 数据框中删除数字和用户的停用词

倚天杖 2023-07-11 14:44:01
我想知道如何从数据集中删除一些变量,特别是数字和字符串列表。例如。    Test      Num0   bam       1321   -         652   creation  473   MAN       324   41        831... ... ...460 Luchino   21461 42 4126   7462 finger    43463 washing   1我想要有类似的东西    Test      Num0   bam       1322   creation  47... ... ...460 Luchino   21462 finger    43463 washing   1我(手动)删除了 MAN (它应该包含在字符串列表中,如停用词)、-和数字。我尝试过 isdigit 但它不起作用,所以我确信我的代码中有错误:df['Text'].where(~df['Text'].str.isdigit())对于我的停用词:my_stop=['MAN','-']df['Text'].apply(lambda lst: [x for x in lst if x in my_stop])
查看完整描述

2 回答

?
繁花不似锦

TA贡献1851条经验 获得超4个赞

如果你想过滤你可以使用.loc

df = df.loc[~df.Text.str.isdigit() & ~df.Text.isin(['MAN']), :]

.where(cond, other)cond返回与 self 形状相同的数据帧或系列,但保留true 的原始值并替换other为 false 的值。


查看完整回答
反对 回复 2023-07-11
?
慕妹3242003

TA贡献1824条经验 获得超6个赞

嗨你应该尝试这个代码:

 df[df['Text']!='MAN']


查看完整回答
反对 回复 2023-07-11
  • 2 回答
  • 0 关注
  • 90 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信