为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas Dataframe 替换异常值

Pandas Dataframe 替换异常值

慕容708150 2023-09-26 16:21:39
预先感谢您的帮助!(下面提供的代码)(此处的数据)我想删除 5 厘米到 225 厘米列的 5/6 标准差之外的异常值,并将它们替换为该日期(月/日)和深度的平均值。最好的方法是什么?import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings('ignore')raw_data = pd.read_csv('all-deep-soil-temperatures.csv', index_col=1, parse_dates=True)df_all_stations = raw_data.copy()df_selected_station.fillna(method = 'ffill', inplace=True);df_selected_station_D=df_selected_station.resample(rule='D').mean()df_selected_station_D['Day'] = df_selected_station_D.index.dayofyearmean=df_selected_station_D.groupby(by='Day').mean()mean['Day']=mean.indexmean.head()
查看完整描述

1 回答

?
慕村225694

TA贡献1880条经验 获得超4个赞

对于更通用的解决方案,假设给您一个带有df某些 column 的数据框a

from scipy import stats.
df[np.abs(stats.zscore(df['a'])) > 5]['a'] = df['a'].mean()


查看完整回答
反对 回复 2023-09-26
  • 1 回答
  • 0 关注
  • 44 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信