科学发现的逻辑 - 第八章 概率

作者: 卡尔·波普尔38,168】字 目 录

些假说基于统计经验,即基于经验上观察到的频率。然而就我来说,我相信,我们在作出这种假说性估计时,往往单独爱关于对称意义的想法以及类似的考虑的引导。我看不出有任何理由为什么这些推测应该只是由于积累大量归纳观察而产生的。然而,我并不赋于我们估计的起源或“来源”这些问题以很大意义(参阅第2节)。我认为,更重要的是对这个事实要十分清晰,即频率的一切预测性估计,包括我们从统计外推中得到的频率——当然还有所有与无穷经验序列有关的频率——总是纯粹的推测,因为它总是超出我们有权根据观察肯定的任何东西。

我对均等-机遇假说和统计外推的区分与“先验”和“后验”概率的经典区分是完全符合的。但是由于这些术语是用于如此多的不同意义。而且由于这些术语因哲学上的联想而被严重玷污,最好还是避免用它们。

我在下面考察随机公理时,将试图寻找逼近随机经验序列的数学序列;这就是说我将考察频率假说。

58随机公理的考察

顺序选择(即按位置选择)的概念和邻域选择的概念均已在第55节中引入和说明。我现在将借助这些概念检查vonmises的随机公理——排除赌博系统原理——以希望找到一个能代替这个公理的较弱的要求。在vonmises的理论中,这个公理是他的集合概念的定义的一部分:他要求一个集合中频率的极限一定要对任何种类的系统选择(systematicselection)不敏感(他指出,赌博系统总是可被认为是一种系统选择。)。

对这个公理提出的大多数批评集中于它的表述的相对不重要的和表面的方面。这与下列事实有关,即在各种可能的选择中,会有这样的选择:比方说选择那些接近5的掷;显然在这种选择内,5的频率会与在原先序列内5的频率迥然不同。这就是为什么vonmises在他的随机公理表述中谈到他所说的“选择”或“选取”是“独立于”掷的“结果”,因而不用所选元素的性质去定义。但是只要指出我们可以根本不用成问题的措词来表述vonmises的随机公理,就可以完全答复针对这种表述的许多非难。因为例如我们可以表述如下:在一个集合中频率的极限一定都不受顺序选择和邻域选择的影响,而且也不受可用作赌博系统的这两种选择方法的所有组合的影响。

上述困难随这个表述而消失。然而其他困难仍保留。因此也许不可能证明,借助如此强的随机公理定义的一个集合概念,不是自相矛盾的;换言之,不可能证明“集合”的类不是空的。(kamke曾强调证明这一点的必要)至少,建构某个集合的例子,并用这种方式说明集合的存在,这似乎是不可能的。这是因为满足一定条件的某一无穷序列的例子只可能由数学规则来提供。但是对于vonmises意义上的集合,根据定义不可能有这种规则,因为能够把任何规则都用作一种赌博系统或选择系统。如果所有可能的赌博系统都被排除,这种批评确实是无法驳斥的。

然而也可提出另外的异议来反对排除所有赌博系统的概念:它的要求实在太多了。如果我们要使某个陈述系统公理化——在这个场合是概率计算定理,尤其是特殊的乘法定理或bernoulli定理——,那么所选的公理不仅应该对系统定理的推导是充分的,而且也是(如果我们能这样推导出定理)必要的。然而可以表明排除所有选择系统对bernoulli定理及其系统定理是不必要的。要求排除特殊类的邻域选择是十分充分的:它是以要求序列应该不受根据任意选取的n个一组的先行者所作的选择的影响;也就是说,它应该有n个自由度,不受每个n的后效的约束,或简言之,它应该是“绝对自由的。”

所以我建议用不那么严格的“绝对自由”的要求(对每一个n有n-自由度的意义上)来代替vonmises的排除赌博系统原理,并且相应地把似机遇的数学序列定义为满足这个要求的序列。其主要优点是不排除所有赌博系统,因此有可能提供建构在我们的意义上“绝对自由的”序列的数学规则,从而有可能建构实例。因此也就满足了上面讨论的kamke的异议。因为我们现在能够证明似机遇数学序列的概念不是空的,所以是前后一致。

也许有点奇怪:我们应该试图借助必须符合最严格规则的数学序列来勾划机遇序列极不规则的特点。vonmises的随机公理起初似乎使我们的直觉更为满意。一个机遇序列必定是完全不规则的,因此只要我们继续努力试图通过把这个序列延伸得足够长来证伪这个推测的话,任何推测的规则性一定会在序列的后面部分遇到失败,知道这一点是颇为令人满意的。但是这个直觉的论证也有利于我的建议。因为如果机遇序列是不规则的,那么,不容置疑,它们就不会是某种特殊类型的规则序列。而我们的“绝对自由”要求不过是排除一种特殊类型的规则序列,尽管是一种重要的类型。

它是一种重要的类型这一点可以从这个事实中看出,即根据我们的要求不言而喻地排除下述三种典型的赌博系统(参阅下一节)。首先我们排除“正态的”或“纯粹的”邻域选择,在其中我们根据邻域的某种恒定的特征进行选择。其次,我们排除“正态的”顺序选择,这种选择选取的元素,它们的间距是恒定的,例如标号为是k,n+k,2n+k……等等的元素;最后,我们排除这两种类型选择的许多组合(例如一切第n个元素的选择,假如它的邻域具有某种具体的恒定特征)。所有这些选择的独特性质是,它们与序列的绝对的第一元素无关;如果原先的序列从另一个(相应的)元素开始标号,它们就可产生同样的所选的子序列。因此被我的要求排除的赌博系统是那些无需知道序列的第一元素而可使用的赌博系统。被排除的系统总涉及某些(线性)变换。它们是简单的赌博系统。(参阅第43节)。我的要求不予排除的只是涉及诸元素与绝对的(初始的)元素间有绝对距离的赌博系统。

对一切n有自由度n——“绝对自由”——的要求也与我们大多数自觉地或不自觉地认为对机遇序列也适用的东西完全一致;例如一粒骰子下一次掷的结果不依赖以前几次掷的结果(掷以前摇摇骰子的做法就是想要保证这种“独立性”)。

59.似机遇序列客观概率

鉴于我已说过的那些东西,我现在提出下列定义。

我们说一个事件序列或性质序列,尤其是一个二择一,是“似机遇”或“随机的”,当且仅当它的主要性质的频率极限是“绝对自由的”,即不受根据任何n个一组的先行者的性质所作的一切选择的影响。与随机的序列相应的频率极限被称为在有关序列内该性质的客观概率;用f表示。这也可表述如下。设α为具有主要性质b的似机遇或似随机序列;这时下式成立:

αf(β)=αf’(β)

现在我们必须证明我们的定义足以推导出数学概率论的主要定理,尤其是bernoulli定理。随后——在第64节——这里给定的定义将予以修改使之独立于频率极限的概念。

60.bernoulli问题

在第56节提到的第一个二项式公式,即

(1)α(n)f”(m)=适用于交迭节段的有限序列。它可根据这样的假定推导出来,即有限序列α至少有n-1个自由度。根据同样的假定,我们直接获得一个有限序列的正好相应的公式;那就是说,如果α是有限的,并且至少有n-1个自由度,那么

(2)α(n)f’(m)=由于似机遇序列是绝对自由的,即对于每一个n有n个自由度,公式(2),即第二个二项式公式也必须适用于那些序列;并且确实它必须适用于它们,不管我们选择的n的值是多少。

下面我们将只涉及似机遇序列,或随机序列(如在前节中定义的那样)。我们就要证明,对于似机遇序列,除了公式(2),第三个二项式公式(3)也必定适用;这个公式是

(3)αnf(m)=

公式(3)在两个方面不同于公式(2):第一,它所断言的涉及毗邻节段αn的序列,不是交迭节段α(n)的序列。第二,它不包含符号f’,而包含符号f。这意味着,根据蕴涵它断言邻近节段序列也是似机遇或随机的;因为从f,即客观概率的定义仅涉及似机遇序列。

(3)所回答的在邻近节段序列中性质m的客观概率问题——即αnf(m)的值的问题——,我效法vonmises,称之为“bernoulli问题。对于这个问题的解决,从而对于第三个二项式公式(3)的推导,假定α是似机遇或随机的也就够了。(我们的任务等于说明特殊的乘法定理适用于一个随机序列α的毗邻节段序列。)

公式(3)的证明可用两步实现。首先,我们证明公式(2)不仅适用于交迭节段α(n)的序列,而且也适用于毗邻序列αn的序列。第二,我们证明后者是“绝对自由的”。(这两步的次序可以颠倒,因为交迭节段α的序列肯定不是“绝对自由的”;事实上,这种序列提供了一个可称之为“具有后效的序列”的典型例子。)

第一步。毗邻节段αn的序列是α(n)的子序列,它们可通过正态顺序选择从α(n)中获得。因此如果我们能证明在交迭序列α(n)f’(m)中频率的极限不受正态顺序选择的影响,我们就是已经采取了第一步(以及甚至走得更远一点);因为我们将证明这个公式:

(4)αnf’(m)=α(n)f’(m)

我将首先以n=2为例概述这个证明;即我将证明

(4a)α2f’(m)=α(2)f’(m)(m≤2)

为真;因此很容易概括这个公式以适用于一切n。

从交迭节段α(2)的序列中,我们能够选择毗邻节段的两个以及仅仅两个不同的节段α(2);一个用(a)表示,包含α(2)的第一,第三,第五……节段,即由数1,2;3,4;5,6;……组成的α的元素对另一个用(β)表示,包含α(2)的第二,第四,第六,……,节段,即由数2,3;4,5;6,7;……等组成α的元素对。现在假定公式(4a)不适用于两个序列中的一个,(a)或(b),结果节段(即对)0,0太经常出现在比方说序列(a)中;于是在序列(b)中必须出现一个余离差(complementarydeviation);即节段0,0将不很经常出现(“太经常”,或“不很经常”是与二项式公式相比较而言的)。但是这与所假定的α的“绝对自由”是矛盾的。因为如果0,0对在(a)中出现比在(b)中更经常,那么在α的足够长的节段中,0,0对在某些表示特征的间距内出现比在其他间距内出现更经常。如果0,0对属于两个α2序列中的一个,更为经常出现的间距就是那些占优势的间距,如果0,0对均属于两个α2-序列,不那么经常出现的序列就是那些占优势的序列。但是这与所假定的α的“绝对自由度”是矛盾的;因为根据第二个二项式公式,α的“绝对自由度”意味着,在任何α(n)序列中一个特定的长度为n的序列出现的频率只依赖在该序列中出现的1和0的数目,而不是依赖它们在序列中的排列。

这证明(4a);由于这个证明能容易推广到任何n,(4)也就得到证明;这就完成了证明的第一步。

第二步。αn序列是绝对自由的这一事实可用一个类似的论据来说明。我们仍可以首先只考虑α2序列;而就这些序列而言,开始只会证明它们的自由度为1。设两个α2序列中的一个,即节段(a)并不是自由度为1。那么在(a)中,在至少由两个元素(一个特定的α对)组成的一个节段之后,比方说在0,0节段之后,另一个节段比方说1,1,必须比如果(a)是“绝对自由的”时更为经常地跟随着;这就是说,节段1,1出现在根据先行节段0,0从(a)中选择的子序列中的频率比二项式公式使我们期望更大。

然而,这个假定与序列α的“绝对自由度”是矛盾的。因为如果节段1,1在(a)中跟随节段0,0过分经常,那么通过补整(compensation),相反情况也必须出现在(b)中;因为否则四个一组0,0,1,1在α的一个足够长的节段中,会太经常地出现在某些特征性间距内——即在如果所说的两对属于同一α2序列就会占优势的那些间距内。此外,在其他特征性间距内,四个一组会不那么经常地出现——即在那些如果它们均属于两个α2序列就会占优势的间距内。因此我们面临的正好是与以前同样的情况;而且我们能用类似的考虑证明,假定事件在一些特有的间距内优先发生,是所假定的α

打 印】 【来源:读书之家-dushuzhijia.com】