书城童书无处不在的数学(人生解密)
2761200000030

第30章 为什么图书馆的书头几页会较脏

如果你经常去图书馆,那么你可能会发现一种奇妙的现象:图书馆的大部分书的头几页通常会比较脏。这是一种很普遍的现象,表面上看来并不奇怪,因为许多到图书馆读书的人大多是先看看书的开头,不喜欢的话就不会再接着读下去了。但是如果你有兴趣的话,再进行一下深入考察,你就会发现同样现象的存在。比如,数学书后的对数表、化学书后的一些化学常数、财务课本后的终值及现值系数表等等,由于这些数学用表是一种工具,只有需要查数据的人才会去碰它,因此,如果头几页比较脏,就说明人们查阅的数据大多在头几页里,同时反映出人们使用的数据并不是散乱的,而是有些数据使用的频率较高。你也可以统计一下所学过的数学、物理课本上面各种数据的开头数字。如果你统计的数据足够多,你就会惊讶地发现,打头数字是1的数据最多,大约占了所有数据的1/3,打头数字是2的数据其次,往后依次减少。这是一种巧合吗?难道人们对1情有独钟年,美国通用电气公司的一位物理学家弗兰克·本福特也发现了这一“见怪不怪”的现象,当时他在图书馆翻阅数学对数表时发现,对数表的头几页比后面的更脏一些,这说明表的头几页在平时被更多的人翻阅。于是,这位物理学家对此产生了极大的兴趣。

通过更进一步的研究,本福特发现,只要统计的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率是0.301,这说明30%的数字都以1开头。而以2为首的数字出现的频率为0.176,而以3打头出现的频率为0.125,往后出现的频率依次减少,9出现的频率最低,只有4.6%。这就是著名的“本福特定律”,也叫做“第一数字定律”。

该定律告诉人们在各种各样不同数据库中每个数字(自然数从1到9)作为首个重要阿拉伯数字的使用频率。除数字1始终占据接近1/3的出现频率外,数字2的出现频率为17.6%,3出现的频率为12.5%,依次递减,9的出现频率是4.6%。在数学术语中,这一数学定律的公式可以表示为F(d)=log[1+(1/d)],此公式中F代表使用频率,d代表待求证数字。

除了对数表,本福特对数字又做了更深一步的研究,他对其他类型的数据进行了统计、调查,发现各种完全不相同的数据,比如人口、死亡率、物理和化学常数、棒球统计表、半衰期放射性同位数、物理书中的答案、素数数字以及斐波纳契数列数字中均有这一定律的身影。换句话说,也就是只要是由度量单位制获得的数据都符合“第一数字定律”。