在变量 中,具有均值
和方差
的正态分布是一种统计分布,其概率密度函数为
(1)
|
定义域为 。虽然统计学家和数学家统一使用术语“正态分布”来指代这种分布,但物理学家有时称其为高斯分布,并且由于其弯曲的喇叭形,社会科学家将其称为“钟形曲线”。Feller (1968) 使用符号
表示上述方程中的
,但随后在 Feller (1971) 中切换为
。
棣莫弗开发了正态分布作为二项分布的近似,随后拉普拉斯在 1783 年将其用于研究测量误差,高斯在 1809 年将其用于天文数据分析(Havil 2003,第 157 页)。
正态分布在 Wolfram 语言中实现为NormalDistribution[mu, sigma]。
所谓的“标准正态分布”是通过在一般正态分布中取 和
给出的。任意正态分布可以通过将变量更改为
转换为标准正态分布,因此
,得到
(2)
|
费希尔-贝伦斯问题是确定检验两个具有不同方差的正态分布的均值是否相等的检验。
正态分布函数 给出了标准正态变量在区间
取值的概率,
(3)
| |||
(4)
|
其中 erf 是有时称为误差函数的函数。 和 erf 都不能用有限的加法、减法、乘法和开方来表示,因此都必须进行数值计算或以其他方式近似。
正态分布是离散二项分布 在样本量
变得很大时的极限情况,在这种情况下,
是正态分布,均值和方差为
(5)
| |||
(6)
|
其中 。
分布 是正确归一化的,因为
(7)
|
累积分布函数,它给出了变量将取值 的概率,是正态分布的积分,
(8)
| |||
(9)
| |||
(10)
|
其中 erf 是所谓的误差函数。
正态分布具有许多方便的特性,因此具有未知分布的随机变量通常被假定为正态分布,尤其是在物理学和天文学中。尽管这可能是一个危险的假设,但由于一个称为中心极限定理的惊人结果,它通常是一个很好的近似。该定理指出,任何具有有限均值和方差的分布的变量集合的均值都趋向于正态分布。许多常见的属性,如考试成绩、身高等等,都大致遵循正态分布,两端成员很少,中间成员很多。
由于正态分布如此频繁地出现,因此不幸的是,人们倾向于在可能不适用的情况下调用正态分布。正如李普曼所说,“每个人都相信误差的指数定律:实验者,因为他们认为可以用数学证明它;数学家,因为他们相信它已经通过观察建立”(Whittaker 和 Robinson 1967,第 179 页)。
正态分布的惊人特性包括,分别通过对来自两个具有任意均值和方差的独立正态分布的变量 和
进行加法和减法获得的正态和分布和正态差分布也是正态分布!从
获得的正态比分布具有柯西分布。
(11)
|
其中
(12)
|
所以
(13)
|
正态分布的特征函数为
(14)
|
并且矩生成函数为
(15)
| |||
(16)
| |||
(17)
|
所以
(18)
| |||
(19)
|
和
(20)
| |||
(21)
|
这些也可以使用
(22)
| |||
(23)
| |||
(24)
|
计算,和之前一样,得到
(25)
| |||
(26)
|
原始矩也可以通过直接计算原始矩 来计算,
(27)
|
(Papoulis 1984,第 147-148 页)。现在令
(28)
| |||
(29)
| |||
(30)
|
给出以高斯积分表示的原始矩,
(31)
|
评估这些积分得到
(32)
| |||
(33)
| |||
(34)
| |||
(35)
| |||
(36)
|
现在找到中心矩,
(37)
| |||
(38)
| |||
(39)
| |||
(40)
|
(41)
| |||
(42)
| |||
(43)
|
正态分布的累积量生成函数为
(44)
| |||
(45)
|
所以
(46)
| |||
(47)
| |||
(48)
|
对于正态变量,当 时,
,因此 k 统计量
的方差为
(49)
| |||
(50)
|
此外,
(51)
| |||
(52)
| |||
(53)
|
其中
(54)
| |||
(55)
|
(56)
|
在正态分布的情况下简化为
(57)
|
(Kenney 和 Keeping 1951,第 164 页)。
如果 是正态分布,则
(58)
|
因此,具有正态分布的变量 可以从在 (0,1) 中具有均匀分布的变量
通过下式生成
(59)
|
然而,获得具有正态分布的数字的更简单方法是使用Box-Muller 变换。
以正态分布作为其解的微分方程是
(60)
|
因为
(61)
|
(62)
|
(63)
|
此方程已被推广以产生更复杂的分布,这些分布使用所谓的皮尔逊系统命名。
正态分布也是卡方分布的一种特殊情况,因为进行替换
(64)
|
得到
(65)
| |||
(66)
|
现在,实线 通过此变换映射到半无限区间
,因此必须向
添加额外的因子 2,将
转换为
(67)
| |||
(68)
|
(Kenney 和 Keeping 1951,第 98 页),其中使用了恒等式 。正如承诺的,(68) 是
中的卡方分布,
(也是
和
的伽玛分布)。