贝叶斯定理:我们几乎每天都在使用的数学工具

原理大探索 2024-10-22 10:37:10

我们的世界观和因其导致的行为往往是由一个简单的定理促成的,在150多年前,这个定理由一位性格内向的英国数学家和神学家托马斯·贝叶斯(Thomas Bayes)悄悄设计,直到他去世后才将其发表。

贝叶斯定理最著名的运用之一是在二战期间被用来破解纳粹的恩尼格码密码。如今,该定理更是广泛深入的被运用在科学、技术、医学等领域。

但什么是贝叶斯定理?它又是如何运作的呢?

【贝叶斯定理 】

托马斯·贝叶斯的洞察力非常简明。一个假设是真实的概率取决于两个标准:

根据当前的知识(“先验”),判断它的合理程度;

评估它与新的证据的契合程度。

然而,在贝叶斯去世后的100多年里,科学家通常仅通过对新的证据来评估他们提出的假设。这是我们大多数人在科学课上受到的传统的假设-检验(频率论者)方法的教育。 当一个不合理的解释与一个新的证据完美契合时,贝叶斯定理和频率论者的方法之间的区别尤为明显。

让我们先来制造一个假设:

“月亮是用奶酪做的!”

△一个不合理的假设。(图片来源:Mike Lee)

接着,我们仰望星空,并收集相关的新证据,并发现月亮的颜色是奶酪黄。在传统的假设-检验框架中,我们会得出新的证据与我们天马行空的假设相符的结论,从而增加了我们对该假设的信心。

△传统的假设-检验方法(频繁方法)只考虑一个假设与新证据的适合程度。(图片来源:Mike Lee)

但如果使用贝叶斯定理,就会得到更加谨慎的结论。我们会意识到虽然这个假设符合新的证据,但这个想法从一开始便极其荒唐,它违背了我们对宇宙学和矿物学所熟识的一切知识。因此,月球是奶酪的综合概率(即这两项评估的乘积)依旧是很低的。

△贝叶斯推理考虑了假设符合现有知识的程度以及它符合新证据的程度。为了简单起见,公式中省略了归一化常数。(图片来源:Mike Lee)

当然,这只是一个极端的例子。没有哪位正经科学家会试图检验这样一个荒诞的假设。 但是,全球科学家们总在不断评估大量的假设,而其中一些假设是相当牵强的。

例如,2010年有一项研究最初表明:

“持有温和政治观点的人可以看到更多的灰色。”

后来这个假设在进一步检验后被驳回,研究人员认识到这是不可信的。然而几乎可以肯定的是,有许多类似的研究已被草率的接受。

【生活中的贝叶斯方法 】

运用先前的经验和记忆中积累的知识、和意识中提炼出的新证据,我们对日常事物的概率进行分配和生活进行管理。

举一个生活中的简单事件:接听手机。通常在工作时你将它放在办公桌上,而在家里时把它放在在充电器上。现在你在家里的小花园里浇花,听到屋内电话声响起。新的数据会告诉你它处于室内任何地方,但你仍会直接走向充电器。因为你将的先前对手机位置的认知(通常在办公桌上或家中的充电器上)与新的证据(房屋的某处)相结合,从而确定了它的位置。

如果手机不在充电器上,那么你会唤起先前你在某些放置过手机的位置的认知来缩小搜索范围。 你会忽略房子里大部分的地方,如冰箱、袜子抽屉等等,因为这些地方在你先前所积累的认知中被认定为极不可能的位置,你会在最终找到电话之前思考最可能的地方。

而在这个找电话的过程中,你便正在使用贝叶斯定理。

认知和证据

贝叶斯推理的一个特征是:当数据较弱时,那么先前对事物的认知是最重要的。这个原则一直被我们直觉性地使用。

例如,你在酒吧玩飞镖,附近的陌生人说他(她)是专业的飞镖选手,那么一开始你很可能会假设这个人在开玩笑。

你对这个陌生人一无所知,但你知道遇到一个真正的专业飞镖选手的几率很小。比如在澳大利亚,专业的飞镖选手只有大约15名。假如他扔了一只飞镖正中靶心,你可能还是不会相信他的说法,因为这可能只是走运的成分。但如果他连续十次都击中靶心,你会更倾向于接受他是专业人士的说法。因为随着新证据的积累,你之前的认知被超越。贝叶斯定理再次起到作用。

【一个统管它们的理论 】

现在,贝叶斯推理支撑着广泛的人类调查领域,从癌症筛查到全球变暖,从遗传学到货币政策等等等等。

例如,贝叶斯推理是风险评估和保险行业的基础。每次飓风或洪水袭击一个地区时,保险费都会飞涨。为什么?

△ 飓风Debbie席卷澳大利亚昆洲,带来的强降雨将居民房屋包围在洪水中。(图片来源:Dan Peled/AAP Image)

量化风险是一件非常复杂的事情,而且目前的条件不足以对未来可能发生的灾难提供足够多的信息。因此,保险公司会根据现时情况并结合过往发生的情况来估算风险。每当自然灾害发生一次时,他们就对该地区的信息进行更新,预计未来索赔的可能性将更大,因此提高保险费。

在医学诊断中,贝叶斯推理也同样发挥着重要作用。一个症状(新证据)可以是多种可能的疾病(假设)的结果,但不同的疾病对于不同的人来说具有不同的先验概率。而在线医疗工具无法将个人的先验概率恰当的考虑在内,这也正是在线医疗的主要问题。它们对你的个人历史知之甚少,因此会忽略一系列可能的疾病。

贝叶斯定理再次告诉我们:向一位了解你之前病史的医生求诊,能获得更高效合理的诊断。

【阿兰•图灵和恩尼格码 】

贝叶斯方法能让我们从模糊的数据中提取准确的信息,从无限可能性的范围中找出更有针对性的解决方案。

这也是阿兰•图灵当年破解德国恩尼格码的核心,它加速了二战的结束,挽救了数百万人的生命,对全世界都意义非凡。若是要在无数的潜在翻译下进行搜索是不可能破译一组加密的德文信息的,尤其是恩尼格码通过不同的转子设置每天变化。

图灵关键的贝叶斯洞察力是一些特定信息比其他信息更有可能,这些可能的解决方案都是基于以前的成功破译的信息和符合逻辑的期望。例如,德国的U型潜艇的信息可能包含与天气或盟军航运相关的短语。

类似这样的先验信息极大地缩小了可能需要评估的翻译数量,使得图灵的密码破译机能以超过日常变化的速度快速破解恩尼格码。

△密码学家用来破解德语恩尼格码的解码机“炸弹”的重建的复制品。(图片来源:Ted Coles/Wikimedia)

【贝叶斯和进化 】

为什么我们对贝叶斯方法如此感兴趣?在大多数科学领域中,比如进化生物学,贝叶斯方法扮演着越来越重要的角色。通过预测气候变化所带来的影响,来分析传染病的传播,生物学家通常从广泛的可能性中寻找一些合理的解决方案。

在进化生物学的研究中,主要涉及重建生命的历史和演化过程,这些方法可以帮助我们从数十亿种可能的分支模式中找到的正确进化树。

无论在工作还是日常生活中,贝叶斯方法可以帮助我们从巨大的干草堆中找到一枚小针头。

【贝叶斯推论的黑暗面 】

当然,如果先验信息被错误地应用在贝叶斯推理上,那么问题就产生了。在法庭上,这可能导致严重的审判不公。英国就曾发生过这样一个著名的案例,萨莉·克拉克在1999年被误判为是她谋杀了她的两个孩子。

公诉人认为,两个婴儿都自然死亡的可能性是极低的(仅7300万分之1),因此断定是她杀死了他们。

但是他们没有考虑到一个母亲杀死自己的孩子的可能性也是非常低的。因此,她完全无辜的可能性与是双重凶手的可能性比公诉人起先认为得要更相近。

克拉克在后来的上诉中,上诉法院的法官批评在原审中所用到的统计学。

这突出说明了对贝叶斯定理缺乏理解会产生多么深远的影响。但是,在具备正当合理的先验条件下,贝叶斯方法可以提供从其他渠道中无法获得的见解。

0 阅读:8