主题
Search

连串


连串是指一个多于一个连续相同结果的序列,也称为聚集。

R_p(r,n) 为在 n 次独立抛掷 硬币(即,n伯努利试验)中出现 r或更多连续正面的概率。这等同于从一个装有两个可区分物体的瓮中重复抽取,每次抽取后放回。设获得正面的概率为 0<p<1。那么,关于 R_p(r,n) 有一个漂亮的公式,以 生成函数 的系数给出

 F_p(r,s)=(p^rs^r(1-ps))/(1-s+(1-p)p^rs^(r+1))=sum_(i=r)^inftyc_i^ps^i
(1)

(Feller 1968,第 300 页)。那么

 R_p(r,n)=sum_(i=r)^nc_i^p.
(2)

下表给出了数字三角形 2^nR_(1/2)(r,n),对于 n=1、2、... 和 r=1、2、...、n (OEIS A050227)。

SloaneA000225A008466A050231A050233
n\r12345678
110000000
231000000
373100000
4158310000
53119831000
663432083100
71279447208310
82552011074820831

特殊情况 r=2 给出了序列

 R_(1/2)(2,n)=2^(n+1)-F_(n+3),
(3)

其中 F_n 是一个 斐波那契数。类似地,在 n 次抛掷中不出现 k 次连续反面的概率由 F_(n+2)^((k))/2^n 给出,其中 F_l^((k)) 是一个 斐波那契 k 步数

Feller(1968,第 278-279 页)证明了对于 w(n)=1-R_(1/2)(3,n)

 lim_(n->infty)w(n)alpha^(n+1)=beta,
(4)

其中

alpha=(x^3+2x^2+4x-8)_1
(5)
=1.087378025...
(6)

(OEIS A086253)是上述多项式的正根,并且

beta=(2-alpha)/(4-3alpha)
(7)
=(11x^3-22x^2+12x-2)_1
(8)
=1.236839844...
(9)

(OEIS A086254)是上述多项式的正根。对于 k>1 次正面连串,相应的常数是 alpha_k,即

 1-x+(1/2x)^(k+1)=0,
(10)

 beta_k=(2-alpha)/(k+1-kalpha_k).
(11)

对于 P(H)=pP(T)=q=1-p 的不公平硬币,这些常数被修改为 alpha_k^',即

 1-x+qp^kx^(k+1)=0,
(12)

 beta_k^'=(1-palpha_k^')/((k+1-kalpha_k^')p)
(13)

(Feller 1968,第 322-325 页)。

给定 n伯努利试验,成功的概率(正面)为 p,则反面的期望数为 n(1-p),因此反面连串 >=1 的期望数为  approx n(1-p)p。继续,

 N_R=n(1-p)p^R
(14)

是连串 >=R 的期望数。因此,最长的期望连串由下式给出

 R=log_(1/p)[n(1-p)]
(15)

(Gordon et al. 1986,Schilling 1990)。给定 m 个 0 和 n 个 1,具有 u 个连串的可能排列数为

 f_u={2(m-1; k-1)(n-1; k-1)   u=2k; (m-1; k)(n-1; k-1)+(m-1; k-1)(n-1; k)   u=2k+1
(16)

对于 k整数,其中 (n; k) 是一个 二项式系数(Johnson 和 Kotz 1968,第 268 页)。那么

 P(u<=u^')=sum_(u=2)^(u^')(f_u)/((m+n; m)).
(17)

现在考虑从包含 m 个一种类型的不可区分物体和 k 个另一种类型的不可区分物体的 N 个物体的集合中不放回地抽取 N 个物体。设 N(r;m,k) 表示这些物体的排列数,其中没有 r 连串出现。例如,类型 A 的两个物体和类型 B 的两个物体有 6 种排列。在这些排列中,AABBABBABAABBBAA 包含长度为 2 的连串,因此 N(2;2,2)=2。一般来说,r 连串确实发生的概率由下式给出

 P(r;m,k)=1-(N(r;m,k))/((m+k; k)),
(18)

其中 (a; b) 是一个 二项式系数。Bloom(1996)给出了 N(r;m,k) 的以下递推序列,

 N(r;m,k)=e(r;m,k)+sum_(i=0)^(r-1)N(r;m-1,k-i)-sum_(i=1)^(r-1)N(r;m-r,k-i),
(19)

其中当 mk 为负数时,N(r,m,k)=0,并且

 e(r;m,k)={1   if m=0 and 0<=k<r; -1   if m=r and 0<=k<r; 0   otherwise.
(20)

另一个只有固定项数的递推式由下式给出

 N(r;m,k)=N(r;m-1,k)+N(r;m,k-1)-N(r;m-r,k-1)-N(r;m-1,k-r)+N(r;m-r,k-r)+e_r^*(m,k),
(21)

其中

 e_r^*(m,k)={1   if (m,k)=(0,0) or (r,r); -1   if (m,k)=(0,r) or (r,0); 0   otherwise
(22)

(Goulden 和 Jackson 1983,Bloom 1996)。

这些公式可用于计算一副 52 张牌的牌组中获得 n 张相同颜色牌的连串的概率。对于 N=1、2、...,这产生了序列 1, 247959266474051/247959266474052, ... (OEIS A086439A086440)。通过乘以 (52; 26) 进行归一化得到 495918532948104, 495918532948102, 495891608417946, 483007233529142, ... (OEIS A086438)。结果

 P(6;26,26)=(2740784175881)/(5903792058906)=0.46424...
(23)

反驳了 Gardner (1982) 的断言,即在普通牌组中“几乎总是会有六到七张相同颜色的聚集在一起”。

Bloom (1996) 给出了 r 连串(即,将序列分成相同值的最大聚集,并计算长度 >=r 的此类聚集的数量)在 m 个 0 和 n 个 1 的序列中的期望数,为

 E(n,m,r)=((m+1)(n)_r+(n+1)(m)_r)/((m+n)_r),
(24)

其中 (a)_n递降阶乘。对于 m>10u 近似服从 正态分布,其 均值方差

mu_u=1+(2mn)/(m+n)
(25)
sigma_u^2=(2mn(2mn-m-n))/((m+n)^2(m+n-1)).
(26)

另请参见

, 抛硬币, 欧拉数, 超几何分布, 排列, 排列连串, s-连串

使用 Wolfram|Alpha 探索

参考文献

Bloom, D. M. "Probabilities of Clumps in a Binary Sequence (and How to Evaluate Them Without Knowing a Lot)." Math. Mag. 69, 366-372, 1996.Feller, W. An Introduction to Probability Theory and Its Application, Vol. 1, 3rd ed. New York: Wiley, 1968.Finch, S. R. "Feller's Coin Tossing Constants." §5.11 in Mathematical Constants. Cambridge, England: Cambridge University Press, pp. 339-342, 2003.Gardner, M. Aha! Gotcha: Paradoxes to Puzzle and Delight. New York: W. H. Freeman, p. 124, 1982.Godbole, A. P. "On Hypergeometric and Related Distributions of Order k." Commun. Stat.: Th. and Meth. 19, 1291-1301, 1990.Godbole, A. P. and Papastavridis, G. (Eds.). Runs and Patterns in Probability: Selected Papers. New York: Kluwer, 1994.Gordon, L.; Schilling, M. F.; and Waterman, M. S. "An Extreme Value Theory for Long Head Runs." Prob. Th. and Related Fields 72, 279-287, 1986.Goulden, I. P. and Jackson, D. M. Combinatorial Enumeration. New York: Wiley, 1983.Johnson, N. and Kotz, S. Discrete Distributions. New York: Wiley, 1968.Mood, A. M. "The Distribution Theory of Runs." Ann. Math. Statistics 11, 367-392, 1940.Philippou, A. N. and Makri, F. S. "Successes, Runs, and Longest Runs." Stat. Prob. Let. 4, 211-215, 1986.Schilling, M. F. "The Longest Run of Heads." Coll. Math. J. 21, 196-207, 1990.Schuster, E. F. In Runs and Patterns in Probability: Selected Papers (Ed. A. P. Godbole and S. Papastavridis). Boston, MA: Kluwer, pp. 91-111, 1994.Sloane, N. J. A. Sequences A000225/M2655, A008466, A050227, A050231, A050232, A050233, A086253, A086254, A086438, A086439, and A086440 in "The On-Line Encyclopedia of Integer Sequences."

在 Wolfram|Alpha 上被引用

连串

请引用为

Weisstein, Eric W. “连串”。来自 MathWorld--Wolfram Web 资源。 https://mathworld.net.cn/Run.html

学科分类