主题
Search

方差


对于具有分布 P(x)已知 总体均值 mu 的单个 变量 X总体方差 var(X),通常也写作 sigma^2,定义为

 sigma^2=<(X-mu)^2>,
(1)

其中 mu总体均值,而 <X> 表示 X期望值。对于具有 N 个可能值 x_i离散分布,总体方差因此为

 sigma^2=sum_(i=1)^NP(x_i)(x_i-mu)^2,
(2)

而对于 连续分布,它由下式给出

 sigma^2=intP(x)(x-mu)^2dx.
(3)

因此,方差等于第二个 中心矩 mu_2

请注意,在将 sigma^2 解释为方差时,需要谨慎,因为符号 sigma 也常被用作与方差的平方根相关但不等同的参数,例如在对数正态分布麦克斯韦分布瑞利分布中。

如果基础分布未知,则可以计算样本方差

 s_N^2=1/Nsum_(i=1)^N(x_i-x^_)^2,
(4)

其中 x^_样本均值

请注意,上面定义的样本方差 s_N^2 不是 总体方差 sigma^2无偏估计量。为了获得 sigma^2 的无偏估计量,有必要改为定义“偏差校正样本方差”

 s_(N-1)^2=1/(N-1)sum_(i=1)^N(x_i-x^_)^2.
(5)

s_N^2s_(N-1)^2 之间的区别是常见的混淆来源,在查阅文献以确定使用哪种约定,特别是当不明确的符号 s 通常用于两者时,应格外小心。数据列表的偏差校正样本方差 s_(N-1)^2 实现为方差[列表]。

方差的平方根称为标准差

s_N^2 给出总体方差有偏估计量的原因是,实际上是从数据本身估计了两个自由参数 musigma^2。在这种情况下,使用 Student's t 分布 而不是 正态分布 作为模型是合适的,因为,非常笼统地说,Student's t 分布是在不知道 sigma^2 的情况下可以做到的“最佳”选择。

形式上,为了从先验未知 均值(即均值是从样本本身估计的)的 n 个元素的样本中估计总体方差 sigma^2,我们需要 sigma^2无偏估计量。这由 k 统计量 k_2=sigma^^^2 给出,其中

 k_2=N/(N-1)m_2
(6)

m_2=s_N^2 是未针对偏差校正的样本方差

事实证明,量 Ns_N^2/sigma^2 具有 卡方分布

对于数据集 X,通过线性变换获得的数据的方差由下式给出

var(aX+b)=<[(aX+b)-<aX+b>]^2>
(7)
=<(aX+b-a<X>-b)^2>
(8)
=<(aX-amu)^2>
(9)
=<a^2(X-mu)^2>
(10)
=a^2<(X-mu)^2>
(11)
=a^2var(X)
(12)

对于多个变量,方差使用协方差的定义给出,

var(sum_(i=1)^(n)X_i)=cov(sum_(i=1)^(n)X_i,sum_(j=1)^(n)X_j)
(13)
=sum_(i=1)^(n)sum_(j=1)^(n)cov(X_i,X_j)
(14)
=sum_(i=1)^(n)sum_(j=1; j=i)^(n)cov(X_i,X_j)+sum_(i=1)^(n)sum_(j=1; j!=i)^(n)cov(X_i,X_j)
(15)
=sum_(i=1)^(n)cov(X_i,X_i)+sum_(i=1)^(n)sum_(j=1; j!=i)^(n)cov(X_i,X_j)
(16)
=sum_(i=1)^(n)var(X_i)+2sum_(i=1)^(n)sum_(j=i+1)^(n)cov(X_i,X_j).
(17)

线性求和具有类似的形式

var(sum_(i=1)^(n)a_iX_i)=cov(sum_(i=1)^(n)a_iX_i,sum_(j=1)^(n)a_jX_j)
(18)
=sum_(i=1)^(n)sum_(j=1)^(n)a_ia_jcov(X_i,X_j)
(19)
=sum_(i=1)^(n)a_i^2var(X_i)+2sum_(i=1)^(n)sum_(j=i+1)^(n)a_ia_jcov(X_i,X_j).
(20)

这些方程可以使用协方差矩阵表示。


参见

中心矩, Charlier 校验, 协方差, 协方差矩阵, 误差传播, k 统计量, 均值, , 原点矩, 样本方差, 样本方差计算, 样本方差分布, Sigma, 标准误差, 统计相关性 在 MathWorld 课堂中探索此主题

使用 Wolfram|Alpha 探索

参考文献

Kenney, J. F. 和 Keeping, E. S. 统计数学,第 2 部分,第 2 版。 Princeton, NJ: Van Nostrand, 1951.Papoulis, A. 概率、随机变量和随机过程,第 2 版。 New York: McGraw-Hill, pp. 144-145, 1984.Press, W. H.; Flannery, B. P.; Teukolsky, S. A.; 和 Vetterling, W. T. "分布的矩:均值、方差、偏度和等等。" §14.1 在 FORTRAN 数值食谱:科学计算的艺术,第 2 版。 Cambridge, England: Cambridge University Press, pp. 604-609, 1992.Roberts, M. J. 和 Riccardo, R. 方差分析学生指南。 London: Routledge, 1999.

在 Wolfram|Alpha 上引用

方差

请引用为

Weisstein, Eric W. "方差。" 来自 MathWorld--Wolfram Web 资源。 https://mathworld.net.cn/Variance.html

主题分类