区别:

几种朴素贝叶斯分类器的区别在于对于sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP分布的假设,即假设sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP满足的形式。

一、高斯NB

导入

from sklearn.naive_bayes import GaussianNB

假设特征的似然函数满足,

sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP

sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP 和 sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP采用“最大似然估计”

二、Multinomial NB

导入

from sklearn.naive_bayes import MultinomialNB

特征是离散值,通常用样本的概率去估计sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP

为避免有的特征值缺省,一般对样本的概率做Laplace平滑:(a=1时)

sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP

三、Bernoulli NB

原型

class sklearn.naive_bayes.BernoulliNB(alpha=1.0binarize=0.0fit_prior=Trueclass_prior=None)

假设特征的似然满足多元Bernoulli分布,每个特征是一个二值变量

Bernoulli NB判别准则满足:

sklearn.naive_bayes中几种朴素贝叶斯分类器-LMLPHP

区别于Multinomial NB

有文献证明,在短文本分类上Bernoulli NB可能优于Multinomial NB

05-11 18:05