主题
Search

本福特定律


一种现象学定律,也称为首位数字定律、首位数字现象或前导数字现象。本福特定律指出,在列表、统计表等中,数字 1 出现的概率约为 ∼30%,远高于预期的 11.1%(即九个数字中的一个)。例如,通过检查对数表并注意到首页比后面的页更破旧和污损(Newcomb 1881),可以观察到本福特定律。虽然本福特定律无疑适用于现实世界中的许多情况,但最近才通过 Hill (1998) 的工作给出了令人满意的解释。

本福特定律被角色 Charlie Eppes 用作类比,以帮助解决电视犯罪剧集NUMB3RS第二季“The Running Man” (2006) 中的一系列重大盗窃案。

本福特定律适用于非无量纲数据,因此数据的数值取决于单位。如果存在关于这些数字的通用概率分布 P(x),那么它在尺度变换下必须是不变的,因此

 P(kx)=f(k)P(x).
(1)

如果 intP(x)dx=1,则 intP(kx)dx=1/k,归一化意味着 f(k)=1/k。对 k 求导并设置 k=1 得到

 xP^'(x)=-P(x),
(2)

解为 P(x)=1/x。虽然这不是一个合适的概率分布(因为它发散),但物理定律和人类惯例都施加了截止值。例如,随机选择的街道地址遵循接近本福特定律的规律。

BenfordsLaw

如果 10 的许多幂次位于截止值之间,则第一个(十进制)数字是 D 的概率由对数分布给出

 P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)
(3)

对于 D=1, ..., 9,如上所示并在下表中列出。

DP_DDP_D
10.3010360.0669468
20.17609170.0579919
30.12493980.0511525
40.0969190.0457575
50.0791812

然而,本福特定律不仅适用于尺度不变数据,也适用于从各种不同来源选择的数字。解释这一事实需要对乘法下随机变量尾数中心极限定理进行更严格的研究。随着变量数量的增加,密度函数接近上述对数分布的密度函数。Hill (1998) 严格证明,从各种不同分布中随机抽样得到的“分布的分布”实际上是本福特定律 (Matthews)。

本福特定律的一个引人注目的例子是 Plouffe 的“逆符号计算器”数据库中的 5400 万个实常数,其中 30% 以数字 1 开头。下表取自几个不同的来源的数据,显示了 Benford (1938) 在其原始论文中汇编的首位数字的分布。

列。标题123456789样本
A河流,面积31.016.410.711.37.28.65.54.25.1335
B人口33.920.414.28.17.26.24.13.72.23259
C常数41.314.44.88.610.65.81.02.910.6104
D报纸30.018.012.010.08.06.06.05.05.0100
E比热24.018.416.214.610.64.13.24.84.11389
F压力29.618.312.89.88.36.45.74.44.7703
G马力损失30.018.411.910.88.17.05.15.13.6690
H分子量26.725.215.410.86.75.14.12.83.21800
I排水量27.123.913.812.68.25.05.02.51.9159
J原子量47.218.75.54.46.64.43.34.45.591
Kn^(-1), sqrt(n)25.720.39.76.86.66.87.28.08.95000
L设计26.814.814.37.58.38.47.07.35.6560
M读者文摘33.418.512.47.57.16.55.54.94.2308
N成本数据32.418.810.110.19.85.54.75.53.1741
OX 射线电压27.917.514.49.08.17.45.15.84.8707
P美国联盟32.717.612.69.87.46.44.95.63.01458
Q黑体31.017.314.18.76.67.05.24.75.41165
R地址28.919.212.68.88.56.45.65.05.0342
Sn^1, n^2...n!25.316.012.010.08.58.86.87.15.5900
T死亡率27.018.615.79.46.76.57.24.84.1418
平均值30.618.512.49.48.06.45.14.94.71011
概率误差+/-0.8+/-0.4+/-0.4+/-0.3+/-0.2+/-0.2+/-0.2+/-0.3

下表给出了使用多种不同方法遵循本福特定律的尾数首位数字的分布。

方法OEIS序列
圣拉格A0554391, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, ...
洪特A0554401, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, ...
最大余数,黑尔配额A0554411, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1, ...
最大余数,德鲁普配额A0554421, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, ...

另请参阅

对数分布

使用 探索

参考文献

Barlow, J. L. and Bareiss, E. H. "On Roundoff Error Distributions in Floating Point and Logarithmic Arithmetic." Computing 34, 325-347, 1985.Benford, F. "The Law of Anomalous Numbers." Proc. Amer. Phil. Soc. 78, 551-572, 1938.Bogomolny, A. "Benford's Law and Zipf's Law." http://www.cut-the-knot.org/do_you_know/zipfLaw.shtml.Boyle, J. "An Application of Fourier Series to the Most Significant Digit Problem." Amer. Math. Monthly 101, 879-886, 1994.Flehinger, B. J. "On the Probability that a Random Integer Has Initial Digit A." Amer. Math. Monthly 73, 1056-1061, 1966.Franel, J. Naturforschende Gesellschaft, Vierteljahrsschrift (Zürich) 62, 286-295, 1917.Havil, J. "Benford's Law." §14.2 in Gamma: Exploring Euler's Constant. Princeton, NJ: Princeton University Press, pp. 145-155, 2003.Hill, T. P. "Base-Invariance Implies Benford's Law." Proc. Amer. Math. Soc. 12, 887-895, 1995a.Hill, T. P. "The Significant-Digit Phenomenon." Amer. Math. Monthly 102, 322-327, 1995b.Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1995c.Hill, T. P. "The First Digit Phenomenon." Amer. Sci. 86, 358-363, 1998.Knuth, D. E. "The Fraction Parts." §4.2.4B in The Art of Computer Programming, Vol. 2: Seminumerical Algorithms, 3rd ed. Reading, MA: Addison-Wesley, pp. 254-262, 1998.Ley, E. "On the Peculiar Distribution of the U.S. Stock Indices Digits." Amer. Stat. 50, 311-313, 1996.Livio, M. The Golden Ratio: The Story of Phi, the World's Most Astonishing Number. New York: Broadway Books, pp. 232-236, 2002.Matthews, R. "The Power of One." http://www.fortunecity.com/emachines/e11/86/one.html.Newcomb, S. "Note on the Frequency of the Use of Digits in Natural Numbers." Amer. J. Math. 4, 39-40, 1881.Nigrini, M. J. The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies. Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.Nigrini, M. "A Taxpayer Compliance Application of Benford's Law." J. Amer. Tax. Assoc. 18, 72-91, 1996.Nigrini, M. "I've Got Your Number." J. Accountancy 187, pp. 79-83, May 1999. http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm.Nigrini, M. Digital Analysis Using Benford's Law: Tests Statistics for Auditors. Vancouver, Canada: Global Audit Publications, 2000.Plouffe, S. "Graph of the Number of Entries in Plouffe's Inverter." http://www.lacim.uqam.ca/~plouffe/statistics.html.Raimi, R. A. "The Peculiar Distribution of First Digits." Sci. Amer. 221, 109-119, Dec. 1969.Raimi, R. A. "On the Distribution of First Significant Digits." Amer. Math. Monthly 76, 342-348, 1969.Raimi, R. A. "The First Digit Phenomenon." Amer. Math. Monthly 83, 521-538, 1976.Schatte, P. "Zur Verteilung der Mantisse in der Gleitkommadarstellung einer Zufallsgröße." Z. Angew. Math. Mech. 53, 553-565, 1973.Schatte, P. "On Mantissa Distributions in Computing and Benford's Law." J. Inform. Process. Cybernet. 24, 443-455, 1988.Sloane, N. J. A. Sequences A055439, A055440, A055441, and A055442 in "The On-Line Encyclopedia of Integer Sequences."

引用为

Weisstein, Eric W. “本福特定律。” 来自 Web 资源。 https://mathworld.net.cn/BenfordsLaw.html

主题分类