我正在为我的机器学习课程进行家庭作业,但在理解朴素贝叶斯问题时遇到了麻烦。我遇到的问题是下一页上问题2的变体:

https://www.cs.utexas.edu/~mooney/cs343/hw3-old/hw3.html

我拥有的数字略有不同,因此我将使用上面的示例替换作业中的数字。我目前正在尝试弄清第一本书是物理学的可能性。为此,我有一些看起来像这样:

P(物理学| c)= P(物理学)* P(碳|物理学)* p(原子|物理学)* p(生命|物理学)* p(地球|物理学)/ [某物]

P(物理学| c)= .35 * .005 * .1 * .001 * .005 / [某物]

我以我在笔记中看到的示例为基础,但是我似乎无法弄清楚应该除以什么。我还将从注释中提供示例。



也许我正在以错误的方式进行此操作,但是我不确定要除以的P(X)项来自何处。这与文本是物理的概率有什么关系?我认为解决此问题将使剩下的工作变得简单。

最佳答案

分母P(X)只是所有可能类的P(X|Y)*P(Y)之和。

现在,需要注意的是,在朴素贝叶斯中,您不必计算此P(X)。您只需要为每个类别计算P(X|Y)*P(Y),然后选择产生最高概率的类别。

对于您的情况,我假设您必须具有几个类。您提到了physics,但必须有其他内容,例如chemistrymath

因此,您可以计算:

P(physics|X)   = P(X|physics) * P(physics) / P(X)

P(chemistry|X) = P(X|chemistry) * P(chemistry) / P(X)

P(math|X)      = P(X|math) * P(math) / P(X)


P(X)是所有类的P(X|Y)*P(Y)之和:

P(X) = P(X|physics)*P(physics) + P(X|chemistry)*P(chemistry) + P(X|math)*P(math)


(顺便说一句,上面的陈述与您提供的图像中的示例完全相似。方程式在那里有些复杂,但是如果重新排列它们,则会在该示例中找到P(X) = P(X|positive)*P(positive) + P(X|negative)*P(negative))。

要产生答案(即确定Yphysicschemistry中的math),可以在P(physics|X)P(chemistry|X)P(math|X)中选择最大值。

如前所述,您无需计算P(X),因为该术语存在于所有P(physics|X)P(chemistry|X)P(math|X)的分母中。因此,您只需要确定P(X|physics)*P(physics)P(X|chemistry)*P(chemistry)P(X|math)*P(math)中的最大值。

关于machine-learning - 天真贝叶斯困惑;,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39799052/

10-12 19:31