为了账号安全,请及时绑定邮箱和手机立即绑定

如何从数据集中删除离群值

如何从数据集中删除离群值

一只斗牛犬 2019-10-15 09:13:04
我有一些关于年龄与年龄的多元数据。年龄范围为20至40,间隔为2(20,22,24 .... 40),对于每条数据记录,年龄和美容等级均为1-5。当我对这些数据进行箱形图绘制(X轴上的年龄,Y轴上的美容等级)时,每个框的晶须外都绘制了一些离群值。我想从数据框本身中删除这些离群值,但不确定R如何计算其箱形图的离群值。以下是我的数据的示例
查看完整描述

3 回答

?
慕斯709654

TA贡献1840条经验 获得超5个赞

boxplot函数返回用于进行绘图的值(实际上是由bxp()完成:


bstats <- boxplot(count ~ spray, data = InsectSprays, col = "lightgray") 

#need to "waste" this plot

bstats$out <- NULL

bstats$group <- NULL

bxp(bstats)  # this will plot without any outlier points

我故意不回答具体问题,因为我认为删除“异常值”是统计错误。我认为不将它们绘制在箱线图中是可以接受的做法,但是仅由于它们超出了一些标准偏差或一定数量的四分位数宽度而将其删除是对观测记录的系统性和不科学的处理。


查看完整回答
反对 回复 2019-10-15
  • 3 回答
  • 0 关注
  • 1465 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信