二项分布给出了获得正好 次成功的 离散概率分布
,在
次 伯努利试验 中(其中每次 伯努利试验 的结果为真,概率为
,为假,概率为
)。因此,二项分布由下式给出
(1)
| |||
(2)
|
其中 是一个 二项式系数。上面的图显示了在
次试验中获得
次成功的分布,其中
。
二项分布在 Wolfram 语言 中实现为BinomialDistribution[n, p].
在二项分布中,获得更多次成功,超过观察到的 次成功的概率是
(3)
|
其中
(4)
|
二项分布的 特征函数 是
(5)
|
(Papoulis 1984, p. 154)。分布的 矩生成函数 是
(6)
| |||
(7)
| |||
(8)
| |||
(9)
| |||
(10)
| |||
(11)
|
均值 是
(12)
| |||
(13)
| |||
(14)
|
关于 0 的 矩 是
(15)
| |||
(16)
| |||
(17)
| |||
(18)
|
(19)
| |||
(20)
| |||
(21)
|
(22)
| |||
(23)
| |||
(24)
| |||
(25)
|
第一个 累积量 是
(26)
|
(27)
|
平均偏差 由下式给出
(28)
|
对于特殊情况 ,这等于
(29)
| |||
(30)
|
其中 是一个 双阶乘。对于
, 2, ..., 前几个值因此是 1/2, 1/2, 3/4, 3/4, 15/16, 15/16, ... (OEIS A086116 和 A086117)。一般情况由下式给出
(31)
|
Steinhaus (1999, pp. 25-28) 考虑了包含给定数量的谷物 的正方形
的期望数量,在大小为
的棋盘上随机分布
粒谷物后,
(32)
|
取 给出了下表总结的结果。
0 | 23.3591 |
1 | 23.7299 |
2 | 11.8650 |
3 | 3.89221 |
4 | 0.942162 |
5 | 0.179459 |
6 | 0.0280109 |
7 | 0.0036840 |
8 | |
9 | |
10 | |
对于大的 ,可以通过在值
附近展开来获得二项分布的近似值,其中
是最大值,即
。由于 对数 函数是 单调 的,我们可以选择展开 对数。设
,那么
(33)
|
其中
(34)
|
但我们正在最大值附近展开,所以,根据定义,
(35)
|
这也意味着 是负的,所以我们可以写成
。现在,取 (◇) 的 对数 得到
(36)
|
对于大的 和
,我们可以使用 斯特林近似
(37)
|
所以
(38)
| |||
(39)
| |||
(40)
| |||
(41)
| |||
(42)
|
和
(43)
|
为了找到 ,将此表达式设置为 0 并求解
,
(44)
|
(45)
|
(46)
|
(47)
|
因为 。我们现在可以找到展开式中的项
(48)
| |||
(49)
| |||
(50)
| |||
(51)
| |||
(52)
| |||
(53)
| |||
(54)
| |||
(55)
| |||
(56)
| |||
(57)
| |||
(58)
| |||
(59)
|
现在,将分布视为连续的,
(60)
|
由于每一项都比前一项小 阶,我们可以忽略高于
的项,所以
(61)
|
概率必须归一化,所以
(62)
|
和
(63)
| |||
(64)
|
定义 ,
(65)
|
这是一个 正态分布。因此,对于任何固定的 (即使
很小),当
趋于无穷大时,二项分布可以近似为 正态分布。
如果 且
以
这样的方式,那么二项分布收敛到 泊松分布,其 均值 为
。
设 和
是独立的二项 随机变量,由参数
和
表征。条件概率
,给定
,是
(66)
|
请注意,这是一个 超几何分布。