主题
Search

协方差


协方差提供了衡量两个或多个随机变量集之间相关性强度的指标。对于两个随机变量 XY,每个变量的样本大小N,协方差由期望值定义

cov(X,Y)=<(X-mu_X)(Y-mu_Y)>
(1)
=<XY>-mu_Xmu_y
(2)

其中 mu_x=<X>mu_y=<Y> 分别是 均值,可以显式地写成

 cov(X,Y)=sum_(i=1)^N((x_i-x^_)(y_i-y^_))/N.
(3)

对于不相关的变量,

 cov(X,Y)=<XY>-mu_Xmu_Y=<X><Y>-mu_Xmu_Y=0,
(4)

因此,协方差为零。然而,如果变量在某种程度上是相关的,那么它们的协方差将是非零的。事实上,如果 cov(X,Y)>0,那么当 X 增加时,Y 趋于增加;如果 cov(X,Y)<0,那么当 X 增加时,Y 趋于减小。请注意,虽然统计上独立的变量总是互不相关的,但反之不一定成立。

Y=X 的特殊情况下,

cov(X,X)=<X^2>-<X>^2
(5)
=sigma_X^2,
(6)

因此,协方差简化为通常的方差 sigma_X^2=var(X)。这促使我们使用符号 sigma_(XY)=cov(X,Y),这提供了一种一致的方式来表示方差sigma_(XX)=sigma_X^2,其中 sigma_X标准差

导出的量

cor(X,Y)=(cov(X,Y))/(sigma_Xsigma_Y)
(7)
=(sigma_(XY))/(sqrt(sigma_(XX)sigma_(YY))),
(8)

被称为 统计相关性,用于衡量 XY

当查看两个随机变量之和的方差时,协方差尤其有用,因为

 var(X+Y)=var(X)+var(Y)+2cov(X,Y).
(9)

根据定义,协方差是对称的,因为

 cov(X,Y)=cov(Y,X).
(10)

给定 n 个随机变量,表示为 X_1, ..., X_nX_iX_j 的协方差 sigma_(ij)=cov(X_i,X_j) 定义为

cov(X_i,X_j)=<(X_i-mu_i)(X_j-mu_j)>
(11)
=<X_iX_j>-mu_imu_j,
(12)

其中 mu_i=<X_i>mu_j=<X_j> 分别是 X_iX_j均值。量 V_(ij)=cov(X_i,X_j) 的矩阵 (V_(ij)) 称为协方差矩阵

协方差服从以下恒等式

cov(X+Z,Y)=<(X+Z)Y>-<X+Z><Y>
(13)
=<XY>+<ZY>-(<X>+<Z>)<Y>
(14)
=<XY>-<X><Y>+<ZY>-<Z><Y>
(15)
=cov(X,Y)+cov(Z,Y).
(16)

通过归纳,因此得出

cov(sum_(i=1)^(n)X_i,Y)=sum_(i=1)^(n)cov(X_i,Y)
(17)
cov(sum_(i=1)^(n)X_i,sum_(j=1)^(m)Y_j)=sum_(i=1)^(n)cov(X_i,sum_(j=1)^(m)Y_j)
(18)
=sum_(i=1)^(n)cov(sum_(j=1)^(m)Y_j,X_i)
(19)
=sum_(i=1)^(n)sum_(j=1)^(m)cov(Y_j,X_i)
(20)
=sum_(i=1)^(n)sum_(j=1)^(m)cov(X_i,Y_j).
(21)

另请参阅

二元正态分布, 相关系数, 协方差矩阵, 统计相关性, 方差 在 MathWorld 课堂中探索此主题

使用 Wolfram|Alpha 探索

参考文献

Snedecor, G. W. 和 Cochran, W. G. 统计方法,第 7 版。 Ames, IA: Iowa State Press, p. 180, 1980。Spiegel, M. R. 概率与统计的理论和问题,第 2 版。 New York: McGraw-Hill, p. 298, 1992。

在 Wolfram|Alpha 中被引用

协方差

请引用为

Weisstein, Eric W. “协方差。” 来自 MathWorld——Wolfram Web 资源。 https://mathworld.net.cn/Covariance.html

主题分类