科学发现的逻辑 - 第八章 概率

作者: 卡尔·波普尔38,168】字 目 录

所作的选择的影响。

β和γ在α内相互独立或不受影响也可——按照主观理论的观点——解释如下:如果我们被告知类α的某一特定元素具有性质β,那么这个信息是无关的,如果β和γ在α内是相互独立的话;也就是对于这个元素是否也有性质γ这个问题是无关的。如果另一方面我们知道,γ更经常(或不那么经常)发生在子类α·β(已根据β从α中选择出来)中,那么某个元素有性质β的信息对于这个元素是否也有性质γ的问题便是有关的了。

54.有穷序列、顺序选择和邻域选择

设有穷参考类α的元素是编了号的(例如盒子中的每一个钮扣都写上一个数目),并且把它们按照序数排列成序列。在这种序列中我们可以区分出两类具有特殊重要性的选择,即按照元素的序数进行选择,或简称顺序选择,以及按照它的邻域进行选择。

顺序选择是根据依赖于元素序数的性质β从序列α中进行选择,元素的选择必须根据序数决定。例如β可以是性质偶数(even),因此我们从a中选择的一切元素,其序数是偶数。因此选择出来的元素形成一个所选子序列(selectedsub-sequence)。如果性质γ独立于根据β的顺序选择,那么我们也可说,顺序选择对γ而言是独立的;或者我们也可说序列α就γ而言,不受β元素的选择的影响。

邻域选择之有可能是由于这个事实:在把元素排列为编号序列时,某些邻域关系就形成了。这使我们例如有可能选择那些其直接先行者具有性质γ的所有成员;或者比方说,选择那些其第一和第一个先行者,或其第一个后续者具有性质y的所有成员,如此等等。

因此如果我们有一个事件序列——比方说掷钱币猜正反面——,我们就必须区分两类性质:如“正面”或“反面”那样一些的主要性质,这些性质属于与其在序列中位置无关的每一个元素;以及如“偶数”或“反面的后续者”等那样一些次要性质,这些性质是一个元素由于它在序列中的地位而获得的。

具有两个主要性质的序列称为“二择一”。正如vonmises业已表明的(如果我们小心仔细),有可能把概率论的基本点发展为二择一理论,而不牺牲普遍性。用“1”和“0”表示二择一的两种主要性质,每一种二择一可表示为许多1和0的序列。

一种二择一的结构可以是有规律的,或者它也可能是多少不规则的。下面我将更周密地研究某些有穷二择一的这种规律性或不规则性。

55.有穷序列的n-自由度

让我们以有穷二择一α为例,它由一个个1和0组成,有规律地排列如下:

(α)1100110011001100……在这种二择一中,我们有均等的分布,即1和0的相对频率是均等的。如果我们用“f”(1)”示性质1的相对频率,用“f”(0)”示性质0的相对频率,我们可写:

(1)αf”(1)=αf”(0)=1/2

现在我们从α中选择(在α序列内)具有直接接在1后面的邻域性质的所有项。如果我们用“β”表示这种性质,我们可称为所选子序列“α·β“。它有这样的结构:

(α·β)1010101010……

这个序列又是具有均等分布的一种二择一。而且,1和0的相对频率都没有变化;即

(2)α·βf”(1)=αf”(1);α·βf”(0)=αf”(0)

用第53节采用的术语,我们可以说二择一α的主要性质不受根据性质β作的选择的影响;简言之,α不受根据β作的选择的影响。

由于α的每一个元素或具有性质β(即是1的后续者)或是0的后续者,我们可用“”表示后一性质。如果我们现在选择具有性质的元素,我们得到这样的二择一:

(α·)01010101010……

这个序列离均等分布稍有偏差,因为它的始末都是0(因为均等分布a本身以“0’0”结尾)。如果a有2000个元素,那么α·将有500个0,只有499个1。这些离均等分布(或其他分布)的偏差只是因第一个元素或最后一个元素而引起的,可通过使序列足够长而使这些离差变得如我们喜欢的那么小。由于这个理由在下面我们将置这些偏差于不顾;尤其是我们研究的是无穷序列,在那里这些离差就消失了。因此,我们说,二择一α·β有均等的分布,并且二择一α不受有性质的元素的选择的影响。结果,α,或更确切地说,α的主要性质的相对频率都不受根据β和根据作的选择的影响;所以我们可以说,α都不受根据直接先行者的性质所作的每一种选择的影响。

显然,这种无影响是由于二择一α结构的某些方面所致;这些方面可把α与其他二择一区分开来。例如,二择一α.β和α.并非不受根据先行者的性质所作的选择的影响。

现在我们可以研究二择一α,看看它是否也不受其他选择,尤其是根据一对先行者的性质所作的选择的影响。例如,我们可从α中选择那些是一对1,1的后续者的所有元素。并且我们马上看到α并非不受四种可能的对即1,1;1,0;01;0,0中任何一对后续者的选择的影响。在这些情况下,得到的子序列都没有均等分布;反之,它们全都由不间断的块(blocks,或“反复”iterations)组成,即只由1,或只由0组成。

α不受根据单个先行者作的选择的影响,但是并非不受根据成对先行者的选择的影响,这个事实可用主观理论的观点表述如下。关于α中任何元素一个先行者性质的信息,对于这个元素的性质问题是无关的。另一方面,关于元素的成对先行者的性质的信息则是高度有关的;因为给定α据以建立的定律,它使我们能够预测所讨论的元素的性质:关于元素成对先行者性质的信息,可以说给我们提供演绎出预测所需的初始条件。(a据以建立的定律要求一对性质作为初始条件;因此就这些性质而言,它是“二维的”。详细说明一种性质仅是在成为复合时作为初始条件不充分时才是“无关的”。参阅第38节。)

我没有忘记因果性——原因和结果——概念与预测的演绎的关系是多么密切,同时我要利用下列术语。以前作出的关于二择一α的断言:“α不受根据单个先行者作的选择的影响”,我现在用下列说法来表示:“α不受单个先行者任何后效的约束”,或简言之,“α的自由度为1(1-free)”。不像以前那么说α“不受(或受)根据成对先行者所作的选择的影响”,我现在说:“a不受(或受)成对先行者后效的约束”,或简言之,“α的自由度是(不是)2”。

用自由度为1的二择一作为我们的原型,我们现在能够容易地建立也具有均等分布的其他序列,这些序列不仅不受一个先行者的后效约束,即(像α一样)自由度为1,而且还不受一对先行者后效的约束,即自由度为2;此后,我们可以继续达到自由度为3等等的序列。这样把我们引导到对下述是基本的一般概念。这就是不受直至某个数n的一切先行者后效约束的自由度概念;或者如我们将要说的,n-自白度概念。更精确地说,我们称一个序列“自由度为n”,当且仅当它的主要性质的相对频率是“n重无影响”,即不受根据单个先行者和根据成对先行者和根据三个一组的先行者……和根据n个一组先行者作的选择的影响。

自由度为1的二择一α可以用重复任何倍数的生成周期(generatingperiod)。

(a)1100……

来建立。同样我们获得具有均等分布的自由度为2的二择一,如果我们把

(b)10111000……

作为它的生成周期,自由度为3的二择一从生成周期

(c)1011000011110100……

中获得,而自由度为4的二择一从生成周期

(d)01100011101010010000010111110011……

中获得。将会看到:面临一个不规则序列的直觉印象随它n自由度的数n的增长而越强烈。

具有均等分布的一个具n自由度的二择一的生成周期必须包含至少2n+1个元素,作为例子给定的周期,当然可以开始于不同的位置;(c)例如可从它的第四个元素开始,于是我们获得的不是(c),而是

(c’)1000011110100101……

有使序列的n-自由度不变的其他变换。为每一个数目n建立n-自由度序列生成周期的方法则在别处描述。

如果我们把下一生成周期的最初的n个元素加在一个自由度为n的二择一上,于是我们得到一个长度为2[n+1]+n的序列。除了其他性质外,这个序列还有以下的性质:n+1个0和1的每一种排列,即每一个可能的n+1个组,至少在其中发生过一次。

56.节段序列二项式的第一形式

给定一个有穷的序列α,我们称由n个连续元素组成的α的子系列为‘’α的n长度节段”;或更简单地说,“α的n-节段”。如果除了序列α以外,还给定某个定数n,那么我们能够把α的n-节段排列在一个序列中——α的n-节段序列。给定一个序列α,我们就可以从α的最初的n个元素的节段开始这种方式,建立一个新的序列,即α的n-节段序列。其次是α的2到n+1的元素的节段。一般地说,我们把α的从x到x+n-1的诸元素组成的节段看作新序列的第x个元素。如此获得的新序列可称为“α的交迭n-节段(overlappingn一segments)序列”。这个名称表示,新序列的任何两个连续元素(即节段)以这种方式交迭;使它们共有原先序列α的n-1元素。

现在我们通过选择可以从一个交迭节段的序列中,获得其他序列,尤其是毗邻n-节段(adjoiningn-segments)的序列。

一个毗邻n-节段序列只含这样一些n-节段,它们在不交迭的α中,互相直接接续。例如开始也许是原先序列α的编号为1至n的元素的n-节段,续在后面的是n+1至2n,2n+1至3n如此等等的元素的n-节段。一般来说,一个毗邻节段的序列将以α的第k个元素开始,而它的节段将包含α的编号为直至n+k-1,n+k至2n+k-1,2n+k至3n+k-1如此等等的元素。

下面将用“α(n)”示α的交迭n-节段的序列,用“αn”示毗邻n-节段序列。

现在让我们更详细一点考虑交迭节段α(n)的诸序列。这样一种节段的每一个元素是α的一个n-节段。我们可以把例如组成节段的n个一组的有序的0和1看作是α(n)一个元素的主要性质。或者我们可以更为简单地把它的1的数目看作是这个元素(不管1和0的次序)的主要性质。如果我们用“m”表示1的数目,则显然m≤n。

现在我们又从每一个序列α(n)得到一个二择一。如果我们选择一个特定的m(m≤n),并将性质“m”赋予序列α(n)的正好有m个1(所以有n-m个0)的每一个元素,并且把性质“”(非m)赋予α(n)的所有其他元素的话。因此α(n)的每一个元素必定有这两个性质中的一个或另一个。

现在让我们再次设想,给定一个具有主要性质“1”和“0”的一个有穷二择一。设1的频率αf”(1)等于p,0的频率αf”(0)等于q。(我们设分布是不均等的,即p≠q。)

现在让这个二择一α至少有n-1个自由度(n是任意挑选的自然数)。于是我们可向下列的问题:性质m在序列α(n)中出现的频率是多少?换言之,α(n)f”(m)的值是多少?

除了α至少有n-1个自由度外,我们什么也不假定,我们就能用初等算术解决这个问题。答案包含在下列公式中:

(1)α(n)f”(m)=“二项”式(1)的右边是由newton在论述有关别的问题时提出的(有时称为newton公式)。我将称它为“二项式的第一形式”。

由于推导出了这个公式我就不再在有穷参考类内考察频率理论。这个公式将提供给我们一个基础来讨论随机公理。

57无穷序列频率的假说性估计

把为n-自由度有穷序列获得的结果推广到用生成周期(参阅第55节)定义的n-自由度无穷序列是十分容易的。起着参考类(我们的相对频率与此有关)作用的一个无穷的元素序列可称为“参考序列”。它多少与vonmises意义上的“集合”相对应。

n-自由度的概念以相对频率的概念为前提;因为n-自由度的定义要求不受影响——不受根据一定的先行者所作的选择的影响——的是一种性质在其中发生的相对频率。在我们讨论有穷序列的定理中,我将暂时使用(直到第64节)相对频率极限值(用f’表示)概念代替有穷类的相对频率(f”)。只要我们把自己限于根据某个数学规则建立的参考序列

打 印】 【来源:读书之家-dushuzhijia.com】

首页上一页123 4567下一页末页共12页/24000条记录