异常值平均值上下1.96个标准差区间以外的值
编辑日期: 2024-11-28 文章阅读: 次
小技巧12:通过标准差如何找出异常值?
找出异常值常用标准差法,异常值是平均值上下1.96个标准差区间以外的值
import pandas as pd
df = pd.DataFrame({'a':[1,3,np.nan],'b':[4,np.nan,np.nan]})
meangrade = df['a'].mean()
stdgrade = df['a'].std()
toprange = meangrade + stdgrade * 1.96
botrange = meangrade - stdgrade * 1.96
copydf = df
copydf = copydf.drop(copydf[copydf['a']
> toprange].index)
copydf = copydf.drop(copydf[copydf['a']
< botrange].index)
copydf