为了账号安全,请及时绑定邮箱和手机立即绑定

如果它是分类变量,如何替换空值?

如果它是分类变量,如何替换空值?

慕工程0101907 2023-01-04 16:11:07
当我注意到某些值带有“?”时,我试图为我的数据获取虚拟值 作为他们的价值。由于我的数据中有很多行都有这些值,所以我根本无法删除它们。在这种情况下,我应该用什么来代替它们?只是采取类别的模式会有帮助吗?另外,我试图更换?值与模式。df1 = df1[df1.workclass == '?'].replace('?',"Private")但我现在得到一张空桌子。
查看完整描述

2 回答

?
猛跑小猪

TA贡献1858条经验 获得超8个赞

这取决于数据集。有不同的方法适用于不同的特征。有些可能只需要用模式替换。在某些情况下,还会使用不同的 ML 算法和模型,例如随机森林、KNN 等。因此这完全取决于您处理的数据类型。探索数据探索领域。也许可以帮助你。



查看完整回答
反对 回复 2023-01-04
?
慕哥9229398

TA贡献1877条经验 获得超6个赞

您将不得不手动检查不同的变量并决定如何处理每个参数的缺失。例如:您可以删除缺失 >50 pc 的变量,除非它们表明证据权重很高。有些变量可以用中心趋势代替,也可以预测。分类可以用 UNK(未知)等代替。



查看完整回答
反对 回复 2023-01-04
  • 2 回答
  • 0 关注
  • 181 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号