

考虑概率 Q_1(n,d),即在一个由 n 个人组成的群体中,在 d 个等可能生日中,没有两个人拥有相同的生日。 从任意一个人的生日开始,然后注意到第二个人生日不同的概率是 (d-1)/d,第三个人生日与前两个人不同的概率是 [(d-1)/d][(d-2)/d],依此类推,直到第 n 个人。 明确地,




因此,概率 P_2(n,d),即在一个由 n 个人组成的群体中,两个或更多人确实拥有相同的生日,因此是


一般来说,令 Q_i(n,d) 表示在一个由 n 个人组成的群体中,恰好有 i 个人(不多也不少)拥有相同生日的概率。 那么,至少有 k 个人或更多人拥有相同生日的概率由下式给出:


一般来说,Q_k(n,d) 可以使用以下递归关系计算:


(Finch 1997)。 然而,计算此递归函数的时间随着 k 的增加呈指数增长,因此很快变得难以处理。

如果假设一年有 365 天,即忽略闰年的存在,并且假设生日在一年中的分布是均匀的(实际上,在美国,9 月份的出生率比平均水平高出 6% 以上;Peterson 1998),那么至少有 50% 的概率至少有两个人拥有相同生日所需的最少人数 n 满足 P_2(n,365)>=1/2。 这由 n=23 给出,因为

 approx 0.507297.

获得 P_2(n,d)>=1/2 所需的人数 n,对于 d=1, 2, ..., 分别是 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, ... (OEIS A033810)。 至少有 n 个生日重合的 50% 概率所需的最少人数是 1, 23, 88, 187, 313, 460, 623, 798, 985, 1181, 1385, 1596, 1813, ... (OEIS A014088; Diaconis and Mosteller 1989)。

概率 P_2(n,d) 可以估计为

P_2(n,d) approx 1-e^(-n(n-1)/2d)
 approx 1-(1-n/(2d))^(n-1),



(Sayrafiezadeh 1994)。

Q_2 可以显式计算为

Q_2(n,d)=(n!)/(d^n)sum_(i=1)^(|_n/2_|)1/(2^i)(d; i)(d-i; n-2i)

其中 (n; m) 是一个二项式系数,而 _2F_1(a,b,;c;z) 是一个超几何函数。 这给出了 P_3(n,d) 的显式公式为


其中 _2F^~_1(a,b;c;z) 是一个正则化超几何函数

对于给定的值 p=P_k(n,d),人数 n 的一个好的近似值可以通过解方程给出:


解出 n 并取 [n],其中 [n]上限函数 (Diaconis and Mosteller 1989)。 对于 p=0.5k=1, 2, 3, ...,此公式给出 n=1, 23, 88, 187, 313, 459, 622, 797, 983, 1179, 1382, 1592, 1809, ... (OEIS A050255),这些值与真值相差 0 到 4。 对于 np=0.5,且 k<20 的情况,一个更简单但也更差的近似值由下式给出:


(Diaconis and Mosteller 1989),对于 k=3, 4, ...,给出 86, 185, 307, 448, 606, 778, 965, 1164, 1376, 1599, 1832, ... (OEIS A050256)。

“近似”生日悖论,询问需要多少人才能使两个人彼此生日相差一天之内,由 Abramson 和 Moser (1970) 考虑,他们表明 14 人就足够了。 对于在 d 个可能日期中,两个人生日在 k 天之内匹配的概率达到 50-50 所需的最少人数的近似值由下式给出:


(Sevast'yanov 1972, Diaconis and Mosteller 1989)。


