主题
Search

样本方差分布


N 个样本取自具有 中心矩 mu_n 的总体。则 样本方差 m_2 由下式给出

 m_2=1/Nsum_(i=1)^N(x_i-m)^2,
(1)

其中 m=x^_样本均值

样本大小为 Nm_2 的期望值由下式给出

 <s^2>=<m_2>=(N-1)/Nmu_2.
(2)

类似地,样本方差的期望方差由下式给出

<var(s^2)>=<var(m_2)>
(3)
=((N-1)^2)/(N^3)mu_4-((N-1)(N-3)mu_2^2)/(N^3)
(4)

(Kenney 和 Keeping 1951,第 164 页;Rose 和 Smith 2002,第 264 页)。

手动推导方程 (4) 的代数运算相当繁琐,但可以按如下步骤进行。首先注意到

 var(x)=<x^2>-<x>^2,
(5)

因此

 var(s^2)=<s^4>-<s^2>^2.
(6)

<s^2> 的值已从方程 (◇) 中得知,因此仅需找到 <s^4>。通过立即将变量转换为 x_i^'=x_i-mu 并针对这些中心变量执行计算,代数运算将大大简化。由于方差不依赖于基础分布的均值 mu,因此使用变换后的变量获得的结果将给出相同的结果,同时立即消除包含 x_i 奇次幂的项之和的期望值(等于 0)。为了确定 <s^4>,展开方程 (6) 得到

<s^4>=<(s^2)^2>
(7)
=<(<x^2>-<x>^2)^2>
(8)
=<[1/Nsumx_i^2-(1/Nsumx_i)^2]^2>
(9)
=1/(N^2)<(sumx_i^2)^2>-2/(N^3)<sumx_i^2(sumx_i)^2>+1/(N^4)<(sumx_i)^4>.
(10)

处理 (10) 的第一项,

<(sumx_i^2)^2>=<sumx_i^4+sum_(i!=j)x_i^2x_j^2>
(11)
=<sumx_i^4>+<sum_(i!=j)x_i^2x_j^2>
(12)
=N<x_i^4>+N(N-1)<x_i^2><x_j^2>
(13)
=Nmu_4+N(N-1)mu_2^2.
(14)

(◇) 的第二项由下式给出

<sumx_i^2(sumx_j)^2>=<sumx_i^4+sum_(i!=j)x_i^2x_j^2+2sum_(i!=j)x_i^3x_j+sum_(i!=j!=k)x_i^2x_jx_k>
(15)
=Nmu_4+N(N-1)mu_2^2,
(16)

第三项由下式给出

<(sumx_i)^4>=<sumx_i^4+3sum_(i!=j)x_i^2x_j^2+4sum_(i!=j)x_i^3x_j+6sum_(i!=j!=k)x_i^2x_jx_k+sum_(i!=j!=k!=l)x_ix_jx_kx_l>
(17)
=<sumx_i^4>+3<sum_(i!=j)x_i^2x_j^2>
(18)
=Nmu_4+3N(N-1)mu_2^2.
(19)

将 (◇)-(19) 代入 (◇) 得到

<s^4>=1/(N^2)[Nmu_4+N(N-1)mu_2^2]-2/(N^3)[Nmu_4+N(N-1)mu_2^2]+1/(N^4)[Nmu_4+3N(N-1)mu_2^2]
(20)
=(1/N-2/(N^2)+1/(N^3))mu_4+[(N-1)/N-(2(N-1))/(N^2)+(3(N-1))/(N^3)]mu_2^2
(21)
=((N^2-2N+1)/(N^3))mu_4+((N-1)(N^2-2N+3))/(N^3)mu_2^2
(22)
=((N-1)[(N-1)mu_4+(N^2-2N+3)mu_2^2])/(N^3)
(23)

(Kenney 和 Keeping 1951,第 164 页)。将 (◇) 和 (23) 代入 (◇) 得到

var(s^2)=<s^4>-<s^2>^2
(24)
=((N-1)[(N-1)mu_4-(N-3)mu_2^2])/(N^3),
(25)

如前所述。

SampleVarianceDistribution

对于正态分布mu_2=sigma^2mu_4=3sigma^4,因此

m_1(s_(Gaussian)^2)=((N-1)sigma^2)/N
(26)
m_2(s_(Gaussian)^2)=(2(N-1)sigma^4)/(N^2).
(27)

s_(Gaussian)^2 的三阶矩和四阶矩由下式给出

m_3(s_(Gaussian)^2)=(8(N-1)sigma^6)/(N^3)
(28)
m_4(s_(Gaussian)^2)=(12(N-1)(N+3)sigma^8)/(N^4),
(29)

给出 s_(Gaussian)^2 分布的偏度峰度超额

gamma_1(s_(Gaussian)^2)=sqrt(8/(N-1))
(30)
gamma_2(s_(Gaussian)^2)=(12)/(N-1),
(31)

正如 Student 计算的那样。Student 还推测基础分布是 Pearson III 型分布

 f(s^2)=((N/(2sigma^2))^((N-1)/2))/(Gamma((N-1)/2))(s^2)^((N-3)/2)e^(-Ns^2/(2sigma^2)),
(32)

其中 Gamma(z)伽玛函数——R. A. Fisher 随后证明了这一猜想。上面说明了 sigma=1NN=1 到 10 变化的曲线。


另请参阅

均值分布, 样本, 样本方差, 样本方差计算, 标准差分布, 方差

使用 Wolfram|Alpha 探索

参考资料

Kenney, J. F. 和 Keeping, E. S. 统计数学,第 2 部分,第 2 版。 普林斯顿,新泽西州:Van Nostrand,1951 年。Rose, C. 和 Smith, M. D. Mathematica 数理统计。 纽约:施普林格出版社,2002 年。

在 Wolfram|Alpha 上被引用

样本方差分布

引用为

Weisstein, Eric W. "样本方差分布。" 来自 MathWorld--Wolfram Web 资源。 https://mathworld.net.cn/SampleVarianceDistribution.html

主题分类