我正在寻找用 C / C++ 编写的多项朴素贝叶斯分类器,用于 OpenCV 。
我正在寻找算法(或现成的实现),因为它在尝试了解其工作原理时会更有用。
最佳答案
朴素贝叶斯分类器是一种著名的分类算法。特别是在文本分类 Realm ,因此我将对其进行解释。
假设我们有一些培训文档{d1 , d2 , d3 , ... , dm}
,其中每个文档可以由单词{w1,w2,w3, ... , wn}
的集合表示
每个文档都属于某个预定义的类集(此处为二进制大小写(c_0,c_1)
)
我们的任务是将一些新的输入文档d分为c_0
类或c_1
类。
一种直观的方法是进行最大似然估计:
那是,
output c_0 if P(d | c_0) > P(d | c_1) and vice versa.
因此,根据我们对d的定义,我们可以通过
P(d | c_0) = P( {w1,w2,w3...,wn} | c_0)
因为计算给定类别的联合概率非常复杂。因此,我们强烈假设单词是相互独立的,以类(class)为条件。
因此,这导致我们
P(d | c_0) = P({w1,w2,w3...,wn} | c_0) = P(w1|c_0)*P(w2|c_0)*P(w2|c_0)...*P(wn|c_0)
其中每个
P(w | c)
可以很容易地计算为c类中单词w的频率计数。这个强有力的假设是使用“天真”的原因,因为我们只是天真的对每个单词进行序列乘法。
最后采取
answer = argmax P(d | c_0) , P(d | c_1)
将结束此算法我想在您的域中您所寻找的类似于文本分类,只是您需要提取的功能不同。
关于c++ - OpenCV的多项式朴素贝叶斯,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10889382/