我正在为我的机器学习课程进行家庭作业,但在理解朴素贝叶斯问题时遇到了麻烦。我遇到的问题是下一页上问题2的变体:
https://www.cs.utexas.edu/~mooney/cs343/hw3-old/hw3.html
我拥有的数字略有不同,因此我将使用上面的示例替换作业中的数字。我目前正在尝试弄清第一本书是物理学的可能性。为此,我有一些看起来像这样:
P(物理学| c)= P(物理学)* P(碳|物理学)* p(原子|物理学)* p(生命|物理学)* p(地球|物理学)/ [某物]
P(物理学| c)= .35 * .005 * .1 * .001 * .005 / [某物]
我以我在笔记中看到的示例为基础,但是我似乎无法弄清楚应该除以什么。我还将从注释中提供示例。
也许我正在以错误的方式进行此操作,但是我不确定要除以的P(X)项来自何处。这与文本是物理的概率有什么关系?我认为解决此问题将使剩下的工作变得简单。
最佳答案
分母P(X)
只是所有可能类的P(X|Y)*P(Y)
之和。
现在,需要注意的是,在朴素贝叶斯中,您不必计算此P(X)
。您只需要为每个类别计算P(X|Y)*P(Y)
,然后选择产生最高概率的类别。
对于您的情况,我假设您必须具有几个类。您提到了physics
,但必须有其他内容,例如chemistry
或math
。
因此,您可以计算:
P(physics|X) = P(X|physics) * P(physics) / P(X)
P(chemistry|X) = P(X|chemistry) * P(chemistry) / P(X)
P(math|X) = P(X|math) * P(math) / P(X)
P(X)
是所有类的P(X|Y)*P(Y)
之和:P(X) = P(X|physics)*P(physics) + P(X|chemistry)*P(chemistry) + P(X|math)*P(math)
(顺便说一句,上面的陈述与您提供的图像中的示例完全相似。方程式在那里有些复杂,但是如果重新排列它们,则会在该示例中找到
P(X) = P(X|positive)*P(positive) + P(X|negative)*P(negative)
)。要产生答案(即确定
Y
,physics
或chemistry
中的math
),可以在P(physics|X)
,P(chemistry|X)
和P(math|X)
中选择最大值。如前所述,您无需计算
P(X)
,因为该术语存在于所有P(physics|X)
,P(chemistry|X)
和P(math|X)
的分母中。因此,您只需要确定P(X|physics)*P(physics)
,P(X|chemistry)*P(chemistry)
和P(X|math)*P(math)
中的最大值。关于machine-learning - 天真贝叶斯困惑;,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39799052/