统计咨询中心
与零概率事件相遇

作者:房祥忠

引言。人类一直都在探索地外文明,但也都知道在特定星球它存在的概率很小。但即使很小,放在浩瀚宇宙中它存在的概率就很大了。但到目前为止尚没有发现另外的一个文明星球。我们不仅要问,目前在特定星球它能是零概率事件吗?学习过概率论的人都会知道零概率事件,认为零概率事件不是不可能事件,它还是有可能发生的。到底什么情况下才能发生零概率事件呢?本文就零概率事件的发生等有关问题加以讨论。

可能的含义在统计的假设检验中我们认为小概率事件不太可能发生,零概率事件怎么能认为有发生的可能呢。我们试图把这些困扰大家的问题说得明白,但是否说明白了,得由读者判断。先做些简单的刨析。我们说零概率事件可能发生,又说小概率事件在一次试验中不太可能发生,这两句话有没有矛盾?仔细推敲,其实没有矛盾,但两句话里面的“可能”却不是一个含义。对于零概率事件,我们习惯举的一个例子是说,一个连续型随机变量取任何一个特定值的概率为零,但每一个值都有“可能”出现。对于小概率事件,我们说它在一次试验或次数较小的重复试验中不太“可能”发生,是说它出现的概率很小。可以看出在我们所举的这个例子中,对于零概率事件,“可能”是没有概率的概念的,只有“含有”或“包含”的意思。而对于小概率事件,“可能”是有概率的意思。

小概率事件。要谈零概率事件,先谈小概率事件。假设某件事可以重复进行,比如在篮球场进行投篮。随着距离越来越远,通常投中的概率会越来越小。对于一般人来说,站在中线一次投中的概率p会很小,比如1%。这种在一次试验发生的概率很小的事件称为小概率事件。我们认为在一次试验中小概率事件不太可能发生,这就是假设检验思想的来源。在没有任何其它信息的情况下,让你猜一个人站在中线进行投篮的结果,则明智的答案应该猜他没投中。

再考虑相对较少次数的试验。在n次投篮中投中的次数服从二项分布。投中的平均次数以及至少投中一次的概率都是n和p的严格单调增函数。对固定的n,当概率p很小的时候,投中的概率会非常小。另外,如果投篮次数比较少,则投中的概率也会比较小的。另外,一个人到第一次投中投篮所尝试的次数是服从概率上的几何分布。平均值为概率p的倒数。即如果概率p为1%,则第一次投中所用平均次数为100。这可以看出,在较少的投篮次数中,猜没有投中也是合理的。

零概率事件。怎么样给“零概率事件也可能发生”这句话一个更加合理的解释呐?从上一段讨论中我们可以知道,当概率p等于0时,则无论投篮次数多大,投中的概率都为0,第一次投中所用平均次数为无穷大,即永远投不中。实际上,从小概率到零概率发生了本质的变化。对于可以重复的小概率事件,在有限或者无限可列个时刻进行试验,至少发生一次的概率一定大于零,甚至可以为百分之百。但对于零概率事件,在有限或者无限可列个时刻进行试验,无论观测的时间点安排多少次或多么稠密,事件发生的概率一定是零。

那么能否在概率的意义下解释“零概率事件也可能发生”这句话呢?其实还是可以的做到的,但思路要变一变。假如可以对一个事件进行连续观测或试验,则零概率事件至少发生一次的概率大于零甚至以为百分之百。举例来说,考虑一个人从小到大不断增长的身高。对每一个给定的时刻,身高是一个连续型的随机变量,从而取任何一个值的概率都是零。特别的,身高刚好为120厘米的这个事件的概率为也为零。但对大多数人来说,因为身高生长是连续的,可以百分百地保证至少有一个时刻身高刚好为120厘米。也就是说,当观测过程不是离散时间,而是连续时间的时候,则零概率事件的并可以大于零,甚至可以为百分之百. 实际上,如果我们用一个随机变量表示身高为120厘米的时刻,则这个随机变量可以用一个具有密度函数的连续型随机变量来描述,它落在一个区间的概率可以很大。这就像对小概率事件,当离散观测的试验次数无线增加时,至少发生一次的概率趋近百分之百。但对零概率事件,需要连续观测才能百分之百观测到事件的发生。所以,从这个意义上可以说,零概率事件也可能发生。

数学模型。假设空间的一个粒子在做随机游动,任何两个时间段游走的相对距离和方向都是相互独立的。则在任何一个时刻,这个粒子恰好在一个球面的概率为零,但至少有一个时刻在这个球面的概率为百分百。实际上还可以证明有无穷多次在这个球面上的概率也为百分百。再考虑连续取值的马氏过程,即在已知现在时,过去和未来独立的取值连续空间的随机过程。对于这种马氏过程来说,某一时刻取值为某特定值的概率也为零。对于马氏过程来说,有首达时的概念,即首次达到某一值的时刻。在广泛的条件下从理论上可以证明首达时是有限的,即在有限时刻可以取得特定值。从而知道零概率事件的按照连续时间观测到的概率是百分之百。

离散和连续。从上面讨论的内容看,从小概率到零概率的可能发生,是从离散指标到连续指标的本质变化。如果观测时间指标是离散的,则永远发生不了零概率事件。如果观测时间指标是连续的,则某些零概率事件一定可以发生。宇宙中最基本的量是质量、距离和时间,这些量都是连续的。有鉴于此,请大家此刻一起发挥天马行空般的想象力。既然我们说,只要观测或者试验时间连续,零概率也一定发生。我们不妨想一想,宇宙的存在可能是一个零概率事件吗?就拿我们所在的太阳系来说,太阳与九大行星的质量恰好为现在的值才形成了目前的太阳系。它们的质量可以认为是连续取值的随机变量,从这个角度说,太阳系形成的概率为零。但它为什么还能形成, 那是不是因为有一个连续变化的类似于时间的历史长河。同样的,生命的形成甚至文明的出现是否也是这样的零概率事件呢?

容错机制。容错机制也许是让世界五彩缤纷的源泉。在机械制造过程中,各个产品都有最优的设计值。产品的加工制造要按照这个最优设计值进行生产。但要完全达到这个值是一个零概率事件,在有限次的加工中是永远办不到的,从而实际当中总会允许有一定的误差。当这个误差很小的时候,产品是可用的。产品允许误差的存在,这就是容错机制。产品生产如此,自然界中也有这样的容错机制。如果考虑容错机制,宇宙的出现、生命的出现、文明的出现都不是零概率事件了。人们的身高、体重、血压、心跳次数等都允许在一定范围内变化,这也是容错机制的表现。在宇宙、生命和文明形成的过程中,容错机制是否存在呢?如果有容错机制,地外文明存在的机会将极大增加,速度将极大加快。如果没有容错机制,在连续观测的时间中也还是有可能出现的,但速度就可能慢下来。

在处理现实问题时,容错机制应该是出发点,否则可能会出现意想不到的问题。举例来说,关于正态均值的t检验法在实际工作中是常常用到的统计方法,在食品药品检验等很多国家标准中都有采用。知道这个方法的人很多,但很少有人会觉得t检验方法存在什么问题。但做实际工作的很多人会知道其中的不当之处,就是样本量越大时越难通过检验,这与常识不符。究其原因,会发现这是原假设没有考虑容错机制导致。要想给出更加合理的解决方法就需要修改原假设,允许容错机制的存在。

总结。我们讨论了零概率事件发生的情况,就是当允许连续时间重复观测或试验时,则零概率事件是有可能发生,这在一些数学模型中可以严格证明这一点。从而,即使某一刻地外文明存在的可能性很小,即使是零概率的事件,但在连续空间连续时间的进程中,发生的可能性还是很大的。当允许容错机制时事物存在的零概率会变成正概率,在重复试验中存在的可能性会快速增加。