在概率论中,术语“分位数”至少有两种不同的含义。变数 的值域中的特定元素
称为分位数,记为
(Evans et al. 2000, p. 5)。这个特定的含义与所谓的分位数函数密切相关,分位数函数将由某个概率密度函数
达到的每个概率
分配一个值
,定义为
(1)
|
第 个
-分位数
是值
,例如
,它对应于
的累积频率(Kenney 和 Keeping,1962)。如果
,则该量称为四分位数;如果
,则称为百分位数。
分位数的参数化版本实现为分位数[list, q, a, b
,
c, d
],返回
(2)
|
其中 是第
个顺序统计量,
是向下取整函数,
是向上取整函数,
是小数部分,并且
(3)
|
分位数有许多略有不同的常用定义,总结在下表中。
# | 绘图位置 | 描述 | ||||
Q1 | 0 | 0 | 1 | 0 | 反向经验累积分布函数 | |
Q2 | -- | -- | -- | -- | 带平均的反向经验累积分布函数 | |
Q3 | 0 | 0 | 0 | 最接近 | ||
Q4 | 0 | 0 | 0 | 1 | 加州公共工程部方法 | |
Q5 | 0 | 0 | 1 | 黑曾模型(在水文学中常用) | ||
Q6 | 0 | 1 | 0 | 1 | 威布尔分位数 | |
Q7 | 1 | 0 | 1 | 插值点将样本范围划分为 | ||
Q8 | 0 | 1 | 无偏中位数 | |||
Q9 | 0 | 1 | 正态分布的近似无偏估计 |
Wolfram 语言的参数化可以处理所有这些,除了 Q2。在 Q1 中,经验分布函数是不超过任何指定值的估计数据集累积比例。Q2 本质上与 Q1 相同,只是在不连续点取平均值。在 Q3 中,第 个分位数是最接近
的观测值编号,其中
是样本大小。在 Q4 中,插值点将样本范围划分为
个区间。在 Q6 中,顶点将样本划分为
个区域,每个区域的平均概率为
。它由 Weibull 于 1939 年提出,并在平均位置绘制
。Q7 将范围划分为
个区间,其中恰好
位于
的左侧。Q8 在中位数位置绘制
。Q9 用于分位数-分位数图。如果
是正态分布,
是
的绘图位置,则
是
的近似无偏估计。