主题
Search

样本方差计算


当数值计算样本方差 s 时,必须先计算均值,然后才能确定 s^2。这需要存储样本值集。但是,可以使用仅涉及最后一个样本的递归关系来计算 s^2,如下所示。这意味着无需预先计算 mu 本身,并且每一步只需存储一组运行值。

在下文中,使用略微欠佳的符号 mu_j 来表示从前 j 个样本计算出的 mu(即,不是j

 mu_j=(sum_(i=1)^(j)x_i)/j,
(1)

并令 s_j^2 表示从前 j 个样本计算出的偏差校正样本方差 s_(N-1)^2 的值。为均值计算出的前几个值是

mu_1=x_1
(2)
mu_2=(1·mu_1+x_2)/2
(3)
mu_3=(2mu_2+x_3)/3.
(4)

因此,对于 j=2、3,以下等式成立

 mu_j=((j-1)mu_(j-1)+x_j)/j.
(5)

因此,通过归纳法,

mu_(j+1)=([(j+1)-1]mu_((j+1)-1)+x_(j+1))/(j+1)
(6)
=(jmu_j+x_(j+1))/(j+1)
(7)
mu_(j+1)(j+1)=(j+1)mu_j+(x_(j+1)-mu_j)
(8)
mu_(j+1)=mu_j+(x_(j+1)-mu_j)/(j+1).
(9)

根据样本方差的定义,

 s_j^2=(sum_(i=1)^(j)(x_i-mu_j)^2)/(j-1)
(10)

对于 j>=2。定义 s_1=0,然后可以使用递归方程计算 s_j

js_(j+1)^2=j(sum_(i=1)^(j+1)(x_i-mu_(j+1))^2)/j
(11)
=sum_(i=1)^(j+1)(x_i-mu_(j+1))^2
(12)
=sum_(i=1)^(j+1)[(x_i-mu_j)+(mu_j-mu_(j+1))]^2
(13)
=sum_(i=1)^(j+1)(x_i-mu_j)^2+sum_(i=1)^(j+1)(mu_j-mu_(j+1))^2+2sum_(i=1)^(j+1)(x_i-mu_j)(mu_j-mu_(j+1)).
(14)

处理第一项,

sum_(i=1)^(j+1)(x_i-mu_j)^2=sum_(i=1)^(j)(x_i-mu_j)^2+(x_(j+1)-mu_j)^2
(15)
=(j-1)s_j^2+(x_(j+1)-mu_j)^2.
(16)

使用 (◇) 写入

 x_(j+1)-mu_j=(j+1)(mu_(j+1)-mu_j),
(17)

所以

 sum_(i=1)^(j+1)(x_i-mu_j)^2=(j-1)s_j^2+(j+1)^2(mu_(j+1)-mu_j)^2.
(18)

现在处理 (◇) 中的第二项,

 sum_(i=1)^(j+1)(mu_j-mu_(j+1))^2=(j+1)(mu_j-mu_(j+1))^2.
(19)

考虑 (◇) 中的第三项,

sum_(i=1)^(j+1)(x_i-mu_j)(mu_j-mu_(j+1))=(mu_j-mu_(j+1))sum_(i=1)^(j+1)(x_i-mu_j)
(20)
=(mu_j-mu_(j+1))[sum_(i=1)^(j)(x_i-mu_j)+(x_(j+1)-mu_j)]
(21)
=(mu_j-mu_(j+1))(x_(j+1)-mu_j-jmu_j+sum_(i=1)^(j)x_i).
(22)

但是

 sum_(i=1)^jx_i=jmu_j,
(23)

所以

(mu_j-mu_(j+1))(x_(j+1)-mu_j)=(mu_j-mu_(j+1))(j+1)(mu_(j+1)-mu_j)
(24)
=-(j+1)(mu_j-mu_(j+1))^2.
(25)

最后,将 (◇)、(◇) 和 (◇) 代入 (◇),

js_(j+1)^2=[(j-1)s_j^2+(j+1)^2(mu_(j+1)-mu_j)^2]+[(j+1)(mu_j-mu_(j+1))^2]+2[-(j+1)(mu_j-mu_(j+1))^2]
(26)
=(j-1)s_j^2+(j+1)^2(mu_(j+1)-mu_j)^2-(j+1)(mu_j-mu_(j+1))^2
(27)
=(j-1)s_j^2+(j+1)[(j+1)-1](mu_(j+1)-mu_j)^2
(28)
=(j-1)s_j^2+j(j+1)(mu_(j+1)-mu_j)^2,
(29)

给出了 s_(j+1) 关于 s_jmu_(j+1)mu_j 的所需表达式,

 s_(j+1)^2=(1-1/j)s_j^2+(j+1)(mu_(j+1)-mu_j)^2.
(30)

另请参阅

样本, 样本方差, 样本方差分布, 方差

使用 Wolfram|Alpha 探索

引用为

Weisstein, Eric W. “样本方差计算。” 来自 MathWorld--Wolfram Web 资源。 https://mathworld.net.cn/SampleVarianceComputation.html

主题分类