说明:系列文章 分享 模型,了解更多👉 模型_思维模型目录。概率更新,智慧推断。


1 贝叶斯定理(思维)的应用

1.1 贝叶斯定理应用之在AI中领域中文本分类

说明:考虑到看文章的伙伴很多没有学过人工智能(AI)和Python的,以及因AI涉及到很多术语和专业名词,因此这里弱化了一些准确性,尽可能用通俗易懂的语言来表达。

背景信息说明:

想象一下,你有一个巨大的新闻文章图书馆,每篇文章都已经被归类到了不同的类别,比如“政治”、“体育”或“娱乐”。现在,假设你拿到了一些新的文章,但是这些文章没有标签,你需要决定它们应该放在图书馆的哪个部分。

接下来我们要使用一个工具来做这件事情,这个工具叫做魔法工具-贝叶斯分类器它可以帮助我们决定这些文章的分类。这个工具的魔法基于一个叫做“贝叶斯定理”的古老智慧,它可以帮助我们根据已知的信息来做出猜测。那么如何使用这个魔法工具呢?流程如下:

  1. 了解你的图书馆:首先,我们需要看看图书馆中已有的标签文章,了解每个类别中常见的词汇。

  2. 制作单词卡片:接着,我们将每篇文章分解成单词,并制作成卡片,每个卡片上写一个单词,这样我们就可以看到每篇文章由哪些单词组成。

  3. 统计每个类别的单词:然后,我们统计在每个类别中,每个单词出现的次数,这样我们就可以知道哪些单词是某个类别的常见词。

  4. 用魔法做出分类:当我们拿到一篇新文章时,我们数一数这篇文章中每个单词出现的次数,然后使用我们的魔法工具(贝叶斯定理)来计算这篇文章最有可能属于哪个类别。

假设我们有一篇新文章说:“球进了!我们赢了比赛!”我们数一数这篇文章中的单词,比如“球”、“赢了”、“比赛”,然后我们的魔法工具会告诉我们,这些词在“体育”类别中很常见,所以这篇文章很可能属于“体育”类别。

接下来,我们开始进行结果检验。我们可以通过比较我们的魔法工具的猜测和实际的标签来检查它的准确性。如果我们的魔法工具大多数时候都是正确的,那我们就可以说它做得很好。

这个魔法工具不仅可以用于图书馆的新闻文章分类,还可以用于其他很多地方,比如帮助我们识别垃圾邮件,或者在网上推荐我们可能会喜欢的商品。

通过这个故事,我们希望传达贝叶斯方法在文本分类中的基本概念:通过分析已知信息(图书馆中的文章),我们可以对未知情况(新文章的分类)做出有根据的猜测。这种方法在现实世界中有广泛的应用,并且可以被编程实现,即使没有直接的监督或指导。

最后 我们也说明下贝叶斯定理在人工智能领域的地位:实际上贝叶斯定理在AI领域中中扮演着核心角色,它不仅为机器学习算法提供了理论基础,还广泛应用于自然语言处理、图像识别、推荐系统等多种智能应用。通过概率推理和参数更新,贝叶斯方法帮助机器更好地理解和模拟人类的认知过程,推动了AI在模拟智能行为和处理复杂问题方面的进步。同时,它还在解决大数据挑战、推动深度学习和其他新兴技术发展中发挥着重要作用,是连接认知科学与人工智能的桥梁。

1.2 贝叶斯定理应用之垃圾邮件过滤

垃圾邮件是指未经请求、发送给大量用户的广告或恶意邮件。它们不仅浪费收件人的时间,还可能包含病毒或诈骗信息。因此,有效地过滤垃圾邮件对于保护用户和提高电子邮件系统的效率至关重要。

贝叶斯定理在这里的应用是通过分析邮件内容来预测邮件是否为垃圾邮件。具体步骤如下:

  1. 数据收集:收集大量已知的垃圾邮件和非垃圾邮件样本。

  2. 特征提取:从这些邮件中提取特征,通常是词汇或短语的出现频率。

  3. 训练模型:使用贝叶斯定理计算每个词汇或短语在垃圾邮件中出现的条件概率。

  4. 邮件分类:当收到新邮件时,计算邮件中每个特征词汇的出现频率,并使用贝叶斯定理计算邮件是垃圾邮件的后验概率。

  5. 决策:根据后验概率的阈值决定邮件是否为垃圾邮件。如果概率超过某个阈值,则将邮件标记为垃圾邮件并进行相应的处理。

在实际使用的效果中,使用贝叶斯定理的垃圾邮件过滤器效果显著,能够以极高的准确率识别垃圾邮件。这种方法的优势在于:

  • 自适应性:随着时间的推移和新邮件的不断到来,系统可以不断更新其概率估计,从而提高过滤效果。
  • 灵活性:可以通过调整先验概率和特征选择来自动优化模型。

假设我们有以下数据:

  • 垃圾邮件中包含“免费”这个词的概率是 0.8。
  • 非垃圾邮件中包含“免费”这个词的概率是 0.1。
  • 邮件是垃圾邮件的先验概率是 0.3。

如果收到一封包含“免费”这个词的邮件,我们可以使用贝叶斯定理计算这封邮件是垃圾邮件的后验概率:

模型 贝叶斯定理/思维(通俗解读)-LMLPHP

这意味着在邮件中包含“免费”这个词的情况下,这封邮件是垃圾邮件的概率约为 77.42%。通过这种方式,贝叶斯定理帮助垃圾邮件过滤器在不断变化的环境中保持高效和准确。

1.3 贝叶斯定理应用之症肌无力症的诊断

重症肌无力是一种自身免疫性疾病,影响神经肌肉接头的正常功能,导致肌无力和易疲劳等症状。诊断这种疾病的一种方法是通过疲劳试验,这是一种检查方法,通过观察肌肉在重复活动后的疲劳情况来诊断疾病。

在实际应用中,医生会根据贝叶斯定理来评估测试结果的准确性。例如,如果疲劳试验显示阳性,即表明患者可能患有重症肌无力,但这个结果的准确性并不是100%。根据贝叶斯定理,医生会考虑先验概率(即在没有进行测试前患者患病的概率)和测试的准确性(包括真阳性率和假阳性率)来计算后验概率(真实发生的概率),即在测试结果为阳性的情况下患者实际患病的概率。

具体来说,如果重症肌无力的患病率很低,比如0.05%,即使测试的假阳性率只有1%,在测试结果为阳性的情况下,患者实际患病的概率也只有4.483%。这是因为大多数阳性结果是由假阳性造成的。这个计算过程体现了贝叶斯定理在实际医疗诊断中的价值,帮助医生更准确地解释和利用测试结果。

这里我们可以看到贝叶斯定理可以帮助我们在现实世界中处理不确定性和做出更合理的推断。

1.4 贝叶斯定理应用之卡尼曼的心理学实验

心理学家丹尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特沃斯基(Amos Tversky)在其研究中使用了贝叶斯定理来解释人们在做出职业判断时的偏差。

他们描述了一个名叫“Steve”的人,他非常害羞且性格孤僻,乐于助人,但对周围世界不感兴趣。Steve是一个温顺且井井有条的人。然后问参与者,基于这些描述,Steve更可能是一名图书管理员还是农民。

大多数人会根据Steve的性格描述,直觉上认为他更可能是图书管理员,因为这些特征更符合图书管理员的职业形象。

然而,根据贝叶斯定理,这种直觉判断忽略了一个重要的先验概率。图书管理员与农民在总人口中的比例。在美国,农民的数量远远超过图书管理员。如果考虑到这个比例,即使Steve的性格特征在图书管理员中更为常见,他更可能是农民。

具体计算过程如下:

  • 假设农民人数是图书管理员的20倍。
  • 假设农民中有10%符合Steve的描述,而图书管理员中有40%符合。
  • 在所有符合描述的人中,农民的比例会远高于图书管理员。

结果就是:图书管理员中符合Steve描述的比例更高,但由于农民的基数大得多,根据贝叶斯定理,Steve更可能是农民。人们在做判断时经常会忽略基础比率的影响,从而导致非理性的判断。

这说明了贝叶斯定理如何帮助心理学家理解和解释人们在面对不确定性时的判断和决策过程,以及如何通过考虑先验概率来纠正直觉偏差。

1.5 贝叶斯定理应用之投资决策分析

投资决策往往涉及大量的不确定性,投资者需要基于有限的信息做出判断。贝叶斯定理提供了一种在信息不完整的情况下,通过动态调整信念的方法来做出更加合理的决策。

一位投资者在制定投资策略时,采用了贝叶斯定理的理念,分为以下步骤:

  1. 先验概率(Prior Probability):投资者根据市场情况、行业趋势和公司基本面分析,形成一个先验信念,即在没有新信息的情况下对公司价值的初步估计。

  2. 收集证据(Evidence):投资者收集有关公司的新信息,如财报数据、行业新闻、管理层变动等,作为影响投资决策的证据。

  3. 计算调整因子(Likelihood):对于每项新信息,投资者评估其对公司价值的影响,并计算出相应的条件概率。

  4. 更新信念(Posterior Probability):使用贝叶斯定理更新对公司价值的信念,即后验概率,反映在新证据下的公司价值估计。

  5. 投资决策:根据更新后的信念,投资者决定是否调整其投资组合,如增持、减持或持有。

基于以上的投资策略,假设投资者对一家生物科技公司感兴趣,该公司正在研发一种新药。初始时,由于新药研发的不确定性,投资者对公司的价值持保守态度。确认基本信息如下:

  • 先验概率:基于公司历史表现和行业情况,投资者认为新药成功上市的概率为30%。
  • 收集证据:公司公布了早期临床试验的积极结果,显示出新药的有效性和安全性。
  • 计算调整因子:根据新药临床试验的成功率和市场潜力,投资者调整了对新药成功的概率至60%。
  • 更新信念:结合先验概率和调整因子,投资者更新了对公司价值的信念,认为新药成功上市的后验概率为50%。
  • 投资决策:基于更新后的概率,针对本行业的特点,值得搏一把,因此投资者决定增加对该公司的投资。

结论:贝叶斯定理允许投资者在不断获得新信息的过程中,逐步调整其对公司价值的评估,从而做出更加理性和准确的投资决策。这种方法特别适用于高不确定性的创业公司投资,其中新信息可能显著改变公司的未来前景。通过贝叶斯方法,投资者可以更有效地管理风险,优化投资组合。

1.6 贝叶斯定理解读经典的三门问题

三门问题(Monty Hall problem),又称蒙提霍尔问题或山羊汽车问题,是一个著名的数学概率论问题,源自美国电视游戏节目《Let's Make a Deal》中的一个游戏环节,由节目主持人蒙提·霍尔(Monty Hall)命名。

问题描述:

  • 游戏中有三扇关闭的门。
  • 其中一扇门后面有一辆汽车(作为奖品),另外两扇门后面各有一只山羊。
  • 参赛者首先会选择一扇门,但不会立即打开。
  • 然后,主持人(知道每扇门后的内容)会打开剩下两扇门中的一扇,露出一只山羊。
  • 此时,主持人会给参赛者一个选择:继续选择原来的门,或者换到另一扇仍然关闭的门。
  • 问题是:参赛者是否应该改变最初的选择,以增加赢得汽车的概率?

直觉与现实的差异:

大多数人的直觉会认为,由于最初每扇门背后有奖品的概率是1/3,所以在主持人排除了一扇门后,剩下两扇门的概率应该是1/2。然而,实际上如果参赛者换门,赢得汽车的概率会增加到2/3。

解释:

  • 如果参赛者最初选择的门后有汽车,那么换门后必输,这种情况的概率是1/3。
  • 如果参赛者最初选择的门后是山羊,那么换门后必赢,这种情况的概率是2/3。

因此,从概率的角度来看,换门是更优的策略,可以显著提高获胜的机会。关于三门问题,想有更直观的感受,还是视频更容易理解一些,B站链接如下:

烧脑悖论:三门问题到底换不换门?如何确认自己不是缸中之脑?_哔哩哔哩_bilibili

也可以直接打开视频:

烧脑悖论:三门问题到底换不换门?如何确认自己不是缸中之脑?

三门问题展示了概率论中的一个反直觉现象,即在某些情况下,改变选择可以显著改变结果的概率。这个问题也常被用来说明贝叶斯定理在实际决策中的应用。接下来我们使用贝叶斯定理来解释下三门问题,步骤如下:

  1. 定义事件

    • 假设三扇门分别用 A、B、C 表示,其中汽车位于门 A 的背后。
    • 参赛者最初选择了门 A。
    • 主持人打开了门 B,露出了山羊。
  2. 先验概率:在没有任何新信息的情况下,汽车位于任何一扇门背后的概率是相同的,即 P(A) = P(B) = P(C) = 1/3。

  3. 主持人的行动:主持人知道汽车的位置,并且打开了没有汽车的门 B。这一行动不是随机的,而是基于主持人知道的信息。

  4. 更新概率:当主持人打开门 B 后,我们获得了新信息:门 B 后面是山羊。我们需要使用贝叶斯定理来更新汽车位于门 A 或 C 的概率。

  5. 应用贝叶斯定理

    • 贝叶斯定理表达式为 P(H|E) = P(E|H) * P(H) / P(E),其中 H 是假设(例如汽车在门 A 背后),E 是新证据(主持人打开了门 B)。
    • 在这个情况下,我们需要计算 P(A|D) 和 P(C|D),其中 D 是主持人打开了门 B 的事件。
  6. 计算条件概率

    • P(D|A):如果汽车在 A,主持人打开 B 的概率是 1/2,因为主持人可以打开 C 或 B。
    • P(D|C):如果汽车在 C,主持人打开 B 的概率是 1,因为主持人必须打开 B。
    • P(A) 和 P(C) 都是 1/3,因为参赛者最初随机选择。
  7. 计算分母 P(D)

    • P(D) = P(D|A) * P(A) + P(D|C) * P(C) = (1/2 * 1/3) + (1 * 1/3) = 1/2。
  8. 计算后验概率

    • P(A|D) = P(D|A) * P(A) / P(D) = (1/2 * 1/3) / (1/2) = 1/3。
    • P(C|D) = P(D|C) * P(C) / P(D) = (1 * 1/3) / (1/2) = 2/3。
  9. 结论:根据贝叶斯定理,换门(选择 C)后赢得汽车的概率是 2/3,而保持最初的选择(门 A)赢得汽车的概率仍然是 1/3。

通过贝叶斯定理的分析,我们可以看到,即使最初的选择(门 A)和未被主持人打开的另一扇门(门 C)在没有新信息时概率相同,但在获得新信息(主持人打开了门 B)后,换门会显著提高获胜的概率。

2 模型 贝叶斯定理(思维)

2.1 什么是 贝叶斯定理(思维)

贝叶斯定理(Bayes' Theorem)是概率论中的一个重要概念,它描述了在给定相关证据或数据的情况下,某个假设的概率如何变化。

贝叶斯定理的起源可以追溯到18世纪的英国数学家托马斯·贝叶斯(Thomas Bayes)。贝叶斯是一位神学家、数学家、数理统计学家和哲学家,被认为是概率论理论的创始人之一,同时也是贝叶斯统计的创立者。他在生前撰写了一篇文章,旨在解决所谓的“逆概”问题,即在没有先验知识(先验知识,就像我们在生活中对某些事情的预感或猜测。想象一下,你有一个朋友,你已经认识他很多年了,你知道他通常很守时。那么,如果明天有一个聚会,你可能会预感他不会迟到。这个预感就是你的先验知识,它基于你过去对他的了解。)的情况下,如何根据观察到的数据来推断一个事件发生的概率。这篇文章在他去世后由他的朋友发表,标志着贝叶斯定理的诞生。

贝叶斯定理的提出,为统计学和概率论的发展做出了重要贡献。它不仅在理论上具有重要意义,而且在实际应用中也非常广泛,特别是在自然语言处理、机器学习、推荐系统、图像识别和博弈论等领域。贝叶斯定理通过结合先验概率和似然度,允许我们更新对某个假设的信念,即计算后验概率,从而在不确定性条件下进行推理和决策。

贝叶斯定理可以用以下公式表示:

模型 贝叶斯定理/思维(通俗解读)-LMLPHP

其中:

  • 𝑃(𝐻∣𝐸)  是在证据 𝐸 出现的情况下,假设 𝐻 成立的概率,也称为后验概率
  • 𝑃(𝐸∣𝐻) 是在假设 𝐻 成立的情况下,证据 𝐸 出现的概率,也称为似然度
  • 𝑃(𝐻) 是在没有考虑任何证据之前,假设 𝐻 成立的概率,也称为先验概率
  • 𝑃(𝐸) 是证据 𝐸 出现的总概率,也称为边缘概率

贝叶斯定理的核心思想是,随着新证据的出现,我们对某个假设的信念(即概率)应该相应地更新。这种方法在统计学、机器学习、人工智能等领域有广泛的应用,特别是在处理不确定性和做出决策时。

贝叶斯思维(Bayesian Thinking)则是一种基于贝叶斯定理的思考方式,它强调在不确定性条件下进行推理和更新信念。这种思维方式鼓励我们根据新的证据不断调整我们对某个假设的评估,而不是仅仅依赖于初始的假设或偏见。

2.2  为什么会有贝叶斯定理(思维)

贝叶斯定理(Bayes' Theorem)的出现和发展有几个可能的原因,这些原因涉及数学、科学、哲学和实际应用等多个方面:

  1. 解决逆概率问题:在贝叶斯之前,人们已经能够计算正向概率,例如在已知条件下事件发生的概率。贝叶斯定理提供了一种方法来解决逆概率问题,即在观察到某些结果后,推断原因或条件的概率。

  2. 基于证据更新信念:贝叶斯定理提供了一种机制,允许我们根据新的证据来更新我们对某个假设的信念。这种基于证据的推理方式对于科学方法和决策过程至关重要。

  3. 统计推断的需求:随着统计学的发展,人们需要一种方法来从样本数据推断总体特征。贝叶斯定理为参数估计和假设检验提供了一种灵活的方法。

  4. 主观概率的数学化:贝叶斯定理允许将主观概率(即个人对事件发生可能性的评估)纳入概率计算中,这为概率论增加了新的维度。

  5. 计算复杂性:在计算机和信息技术发展之前,贝叶斯定理的应用受到限制,因为需要大量的计算。随着计算能力的提升,贝叶斯方法变得更加实用和普及。

  6. 机器学习和人工智能:在机器学习和人工智能领域,贝叶斯方法因其在处理不确定性和进行概率推理方面的优势而变得非常重要。

  7. 哲学和认识论的影响:贝叶斯定理与认识论中的一些观点相吻合,特别是关于知识是如何随着新信息的获得而发展的。

  8. 实际应用的推动:在医学、金融、工程和其他领域,贝叶斯方法在风险评估、决策制定和预测方面显示出其有效性,这推动了其理论和应用的发展。

  9. 科学方法的演变:随着科学方法的演变,人们越来越认识到观察和实验数据的局限性,贝叶斯定理提供了一种更加灵活和全面的方法来处理不确定性。

  10. 跨学科的融合:贝叶斯定理在多个学科领域都有应用,这种跨学科的融合促进了其理论和应用的进一步发展。

总的来说,贝叶斯定理的出现和发展是多种因素共同作用的结果,它不仅在理论上具有重要意义,而且在实际应用中也非常广泛和有价值。

3 模型简图

模型 贝叶斯定理/思维(通俗解读)-LMLPHP

07-29 19:35