统计咨询中心

与零概率事件相遇

2022/12/09

作者：房祥忠

引言。人类一直都在探索地外文明，但也都知道在特定星球它存在的概率很小。但即使很小，放在浩瀚宇宙中它存在的概率就很大了。但到目前为止尚没有发现另外的一个文明星球。我们不仅要问，目前在特定星球它能是零概率事件吗？学习过概率论的人都会知道零概率事件，认为零概率事件不是不可能事件，它还是有可能发生的。到底什么情况下才能发生零概率事件呢？本文就零概率事件的发生等有关问题加以讨论。

可能的含义。在统计的假设检验中我们认为小概率事件不太可能发生，零概率事件怎么能认为有发生的可能呢。我们试图把这些困扰大家的问题说得明白，但是否说明白了，得由读者判断。先做些简单的刨析。我们说零概率事件可能发生，又说小概率事件在一次试验中不太可能发生，这两句话有没有矛盾？仔细推敲，其实没有矛盾，但两句话里面的“可能”却不是一个含义。对于零概率事件，我们习惯举的一个例子是说，一个连续型随机变量取任何一个特定值的概率为零，但每一个值都有“可能”出现。对于小概率事件，我们说它在一次试验或次数较小的重复试验中不太“可能”发生，是说它出现的概率很小。可以看出在我们所举的这个例子中，对于零概率事件，“可能”是没有概率的概念的，只有“含有”或“包含”的意思。而对于小概率事件，“可能”是有概率的意思。

小概率事件。要谈零概率事件，先谈小概率事件。假设某件事可以重复进行，比如在篮球场进行投篮。随着距离越来越远，通常投中的概率会越来越小。对于一般人来说，站在中线一次投中的概率p会很小，比如1%。这种在一次试验发生的概率很小的事件称为小概率事件。我们认为在一次试验中小概率事件不太可能发生，这就是假设检验思想的来源。在没有任何其它信息的情况下，让你猜一个人站在中线进行投篮的结果，则明智的答案应该猜他没投中。

再考虑相对较少次数的试验。在n次投篮中投中的次数服从二项分布。投中的平均次数以及至少投中一次的概率都是n和p的严格单调增函数。对固定的n，当概率p很小的时候，投中的概率会非常小。另外，如果投篮次数比较少，则投中的概率也会比较小的。另外，一个人到第一次投中投篮所尝试的次数是服从概率上的几何分布。平均值为概率p的倒数。即如果概率p为1%，则第一次投中所用平均次数为100。这可以看出，在较少的投篮次数中，猜没有投中也是合理的。

零概率事件。怎么样给“零概率事件也可能发生”这句话一个更加合理的解释呐？从上一段讨论中我们可以知道，当概率p等于0时，则无论投篮次数多大，投中的概率都为0，第一次投中所用平均次数为无穷大，即永远投不中。实际上，从小概率到零概率发生了本质的变化。对于可以重复的小概率事件，在有限或者无限可列个时刻进行试验，至少发生一次的概率一定大于零，甚至可以为百分之百。但对于零概率事件，在有限或者无限可列个时刻进行试验，无论观测的时间点安排多少次或多么稠密，事件发生的概率一定是零。

那么能否在概率的意义下解释“零概率事件也可能发生”这句话呢？其实还是可以的做到的，但思路要变一变。假如可以对一个事件进行连续观测或试验，则零概率事件至少发生一次的概率大于零甚至以为百分之百。举例来说，考虑一个人从小到大不断增长的身高。对每一个给定的时刻，身高是一个连续型的随机变量，从而取任何一个值的概率都是零。特别的，身高刚好为120厘米的这个事件的概率为也为零。但对大多数人来说，因为身高生长是连续的，可以百分百地保证至少有一个时刻身高刚好为120厘米。也就是说，当观测过程不是离散时间，而是连续时间的时候，则零概率事件的并可以大于零，甚至可以为百分之百. 实际上，如果我们用一个随机变量表示身高为120厘米的时刻，则这个随机变量可以用一个具有密度函数的连续型随机变量来描述，它落在一个区间的概率可以很大。这就像对小概率事件，当离散观测的试验次数无线增加时，至少发生一次的概率趋近百分之百。但对零概率事件，需要连续观测才能百分之百观测到事件的发生。所以，从这个意义上可以说，零概率事件也可能发生。

数学模型。假设空间的一个粒子在做随机游动，任何两个时间段游走的相对距离和方向都是相互独立的。则在任何一个时刻，这个粒子恰好在一个球面的概率为零，但至少有一个时刻在这个球面的概率为百分百。实际上还可以证明有无穷多次在这个球面上的概率也为百分百。再考虑连续取值的马氏过程，即在已知现在时，过去和未来独立的取值连续空间的随机过程。对于这种马氏过程来说，某一时刻取值为某特定值的概率也为零。对于马氏过程来说，有首达时的概念，即首次达到某一值的时刻。在广泛的条件下从理论上可以证明首达时是有限的，即在有限时刻可以取得特定值。从而知道零概率事件的按照连续时间观测到的概率是百分之百。

离散和连续。从上面讨论的内容看，从小概率到零概率的可能发生，是从离散指标到连续指标的本质变化。如果观测时间指标是离散的，则永远发生不了零概率事件。如果观测时间指标是连续的，则某些零概率事件一定可以发生。宇宙中最基本的量是质量、距离和时间，这些量都是连续的。有鉴于此，请大家此刻一起发挥天马行空般的想象力。既然我们说，只要观测或者试验时间连续，零概率也一定发生。我们不妨想一想，宇宙的存在可能是一个零概率事件吗？就拿我们所在的太阳系来说，太阳与九大行星的质量恰好为现在的值才形成了目前的太阳系。它们的质量可以认为是连续取值的随机变量，从这个角度说，太阳系形成的概率为零。但它为什么还能形成, 那是不是因为有一个连续变化的类似于时间的历史长河。同样的，生命的形成甚至文明的出现是否也是这样的零概率事件呢？

容错机制。容错机制也许是让世界五彩缤纷的源泉。在机械制造过程中，各个产品都有最优的设计值。产品的加工制造要按照这个最优设计值进行生产。但要完全达到这个值是一个零概率事件，在有限次的加工中是永远办不到的，从而实际当中总会允许有一定的误差。当这个误差很小的时候，产品是可用的。产品允许误差的存在，这就是容错机制。产品生产如此，自然界中也有这样的容错机制。如果考虑容错机制，宇宙的出现、生命的出现、文明的出现都不是零概率事件了。人们的身高、体重、血压、心跳次数等都允许在一定范围内变化，这也是容错机制的表现。在宇宙、生命和文明形成的过程中，容错机制是否存在呢？如果有容错机制，地外文明存在的机会将极大增加，速度将极大加快。如果没有容错机制，在连续观测的时间中也还是有可能出现的，但速度就可能慢下来。

在处理现实问题时，容错机制应该是出发点，否则可能会出现意想不到的问题。举例来说，关于正态均值的t检验法在实际工作中是常常用到的统计方法，在食品药品检验等很多国家标准中都有采用。知道这个方法的人很多，但很少有人会觉得t检验方法存在什么问题。但做实际工作的很多人会知道其中的不当之处，就是样本量越大时越难通过检验，这与常识不符。究其原因，会发现这是原假设没有考虑容错机制导致。要想给出更加合理的解决方法就需要修改原假设，允许容错机制的存在。

总结。我们讨论了零概率事件发生的情况，就是当允许连续时间重复观测或试验时，则零概率事件是有可能发生，这在一些数学模型中可以严格证明这一点。从而，即使某一刻地外文明存在的可能性很小，即使是零概率的事件，但在连续空间连续时间的进程中，发生的可能性还是很大的。当允许容错机制时事物存在的零概率会变成正概率，在重复试验中存在的可能性会快速增加。