我正在研究一个文档,该文档应包含在使用朴素贝叶斯(生成式)模型和逻辑回归模型(判别式)模型进行文本分类之间的主要区别。
在研究过程中,我遇到了朴素贝叶斯模型的定义:https://nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html
当我进入比较生成模型和判别模型的部分时,我发现StackOverflow上的这种解释已被接受:What is the difference between a Generative and Discriminative Algorithm?
在这一点上,我感到困惑:朴素贝叶斯是一个生成模型,并使用条件概率,但是与此同时,区分模型被描述为好像他们学习了条件概率,而不是生成模型的联合概率。
有人可以对此有所启发吗?
谢谢!
最佳答案
从某种意义上讲,它是生成性的,您无需直接为后p(y|x)
建模,而是学习联合概率p(x,y)
的模型,也可以将其表示为p(x|y) * p(y)
(之前的可能性时间),然后通过Bayes rule寻求找到最多的可能
在这种情况下,我可以推荐的一本好书是:“关于判别式与生成式分类器:逻辑回归和朴素贝叶斯的比较”
(Ng & Jordan 2004)
关于machine-learning - 为什么朴素的贝叶斯会产生?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47996747/