主题
Search

异常值


异常值是落在分布的总体模式之外的观测值 (Moore 和 McCabe 1999)。通常,异常值的存在表明某种问题。这可能是不符合研究模型的案例,或者是测量中的错误。

OutlierHistogram

异常值通常很容易在直方图中被发现。例如,上图中最左边的点就是一个异常值。

异常值的一个方便的定义是,一个点落在第三四分位数之上或第一四分位数之下超过 1.5 倍的四分位距

OutlierScatterplot

当比较两组数据之间的关系时,也可能出现异常值。这种类型的异常值可以很容易地在散点图上识别出来。

当对数据执行最小二乘拟合时,通常最好在计算最佳拟合线之前丢弃异常值。对于沿 x 方向的异常值尤其如此,因为这些点可能会极大地影响结果。


另请参阅

直方图, 最小二乘拟合, 散点图 在 MathWorld 课堂中探索此主题

此条目由 John Renze 贡献

使用 Wolfram|Alpha 探索

参考文献

Moore, D. S. 和 McCabe, G. P. Introduction to the Practice of Statistics, 3rd ed. New York: W. H. Freeman, 1999.

在 Wolfram|Alpha 上被引用

异常值

请这样引用

Renze, John. "异常值。" 来自 MathWorld--Wolfram Web 资源,由 Eric W. Weisstein 创建。 https://mathworld.net.cn/Outlier.html

主题分类