当数值计算样本方差 时,必须先计算均值,然后才能确定
。这需要存储样本值集。但是,可以使用仅涉及最后一个样本的递归关系来计算
,如下所示。这意味着无需预先计算
本身,并且每一步只需存储一组运行值。
在下文中,使用略微欠佳的符号 来表示从前
个样本计算出的
(即,不是第
个 矩)
(1)
|
并令 表示从前
个样本计算出的偏差校正样本方差
的值。为均值计算出的前几个值是
(2)
| |||
(3)
| |||
(4)
|
因此,对于 、3,以下等式成立
(5)
|
因此,通过归纳法,
(6)
| |||
(7)
| |||
(8)
| |||
(9)
|
根据样本方差的定义,
(10)
|
对于 。定义
,然后可以使用递归方程计算
(11)
| |||
(12)
| |||
(13)
| |||
(14)
|
处理第一项,
(15)
| |||
(16)
|
使用 (◇) 写入
(17)
|
所以
(18)
|
现在处理 (◇) 中的第二项,
(19)
|
考虑 (◇) 中的第三项,
(20)
| |||
(21)
| |||
(22)
|
但是
(23)
|
所以
(24)
| |||
(25)
|
最后,将 (◇)、(◇) 和 (◇) 代入 (◇),
(26)
| |||
(27)
| |||
(28)
| |||
(29)
|
给出了 关于
、
和
的所需表达式,
(30)
|