威廉·戈塞特于 1908 年发表的一种统计分布。他的雇主吉尼斯啤酒厂要求他使用笔名发表,因此他选择了“Student”。 给定 个独立测量值
,令
(1)
|
其中 是总体均值,
是样本均值,s 是总体标准差(即样本方差)的估计量,定义为
(2)
|
学生 -分布定义为随机变量
的分布,它(非常粗略地)是在不知道
的情况下我们能做的“最好”的。
具有 个自由度的学生
分布在 Wolfram 语言中实现为StudentTDistribution[n].
如果 ,
并且分布变为正态分布。 随着
的增加,学生
-分布接近正态分布。
学生 -分布可以通过使用以下公式转换 Student's z-分布来导出
(3)
|
然后定义
(4)
|
得到的概率和累积分布函数是
(5)
| |||
(6)
| |||
(7)
| |||
(8)
| |||
(9)
|
其中
(10)
|
是自由度数,,
是伽玛函数,
是贝塔函数,
是超几何函数,I(z;a,b) 是由下式定义的正则化贝塔函数
(11)
|
(12)
| |||
(13)
| |||
(14)
| |||
(15)
|
前几个 值的特征函数
是
(16)
| |||
(17)
| |||
(18)
| |||
(19)
| |||
(20)
|
等等,其中 是第二类修正贝塞尔函数。
下表给出了置信区间,即 的值,使得分布函数 分布函数
等于各种概率,对于自由度数
的各种小值。 Beyer(1987 年,第 571 页)给出了 60%、70%、90%、95%、97.5%、99%、99.5% 和 99.95% 的置信区间,Goulden(1956 年)给出了 50%、90%、95%、98%、99% 和 99.9% 的置信区间。
90% | 95% | 97.5% | 99.5% | |
1 | 3.07768 | 6.31375 | 12.7062 | 63.6567 |
2 | 1.88562 | 2.91999 | 4.30265 | 9.92484 |
3 | 1.63774 | 2.35336 | 3.18245 | 5.84091 |
4 | 1.53321 | 2.13185 | 2.77645 | 4.60409 |
5 | 1.47588 | 2.01505 | 2.57058 | 4.03214 |
10 | 1.37218 | 1.81246 | 2.22814 | 3.16927 |
30 | 1.31042 | 1.69726 | 2.04227 | 2.75000 |
100 | 1.29007 | 1.66023 | 1.98397 | 2.62589 |
1.28156 | 1.64487 | 1.95999 | 2.57588 |
具有相关矩阵 和
个自由度的学生
分布的多元形式实现为MultivariateTDistribution[r, m] 在 Wolfram 语言包中MultivariateStatistics` .
所谓的 分布对于测试两个观察到的分布是否具有相同的均值很有用。
给出了对于具有
个自由度的某个统计量
,两个观察到的均值之差纯粹是偶然机会小于观察值的概率
(21)
|
令 为均值为 0 且方差为 正态分布的随机变量,令 均值
,令
具有自由度为 卡方分布
,并令 自由度
和
独立。 然后
(22)
|
分布为自由度为 的学生
分布。