我正在寻找用 C / C++ 编写的多项朴素贝叶斯分类器,用于 OpenCV

我正在寻找算法(或现成的实现),因为它在尝试了解其工作原理时会更有用。

最佳答案

朴素贝叶斯分类器是一种著名的分类算法。特别是在文本分类 Realm ,因此我将对其进行解释。

假设我们有一些培训文档{d1 , d2 , d3 , ... , dm},其中每个文档可以由单词{w1,w2,w3, ... , wn}的集合表示
每个文档都属于某个预定义的类集(此处为二进制大小写(c_0,c_1))
我们的任务是将一些新的输入文档d分为c_0类或c_1类。

一种直观的方法是进行最大似然估计:
那是,

output c_0 if P(d | c_0) > P(d | c_1) and vice versa.

因此,根据我们对d的定义,我们可以通过
P(d | c_0) = P( {w1,w2,w3...,wn}  | c_0)

因为计算给定类别的联合概率非常复杂。因此,我们强烈假设单词是相互独立的,以类(class)为条件。
因此,这导致我们
P(d | c_0) = P({w1,w2,w3...,wn} | c_0) = P(w1|c_0)*P(w2|c_0)*P(w2|c_0)...*P(wn|c_0)

其中每个P(w | c)可以很容易地计算为c类中单词w的频率计数。

这个强有力的假设是使用“天真”的原因,因为我们只是天真的对每个单词进行序列乘法。

最后采取answer = argmax P(d | c_0) , P(d | c_1)将结束此算法

我想在您的域中您所寻找的类似于文本分类,只是您需要提取的功能不同。

关于c++ - OpenCV的多项式朴素贝叶斯,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10889382/

10-10 01:14