区别:
几种朴素贝叶斯分类器的区别在于对于分布的假设,即假设满足的形式。
一、高斯NB
导入
from sklearn.naive_bayes import GaussianNB
假设特征的似然函数满足,
和 采用“最大似然估计”
二、Multinomial NB
导入
from sklearn.naive_bayes import MultinomialNB
特征是离散值,通常用样本的概率去估计
为避免有的特征值缺省,一般对样本的概率做Laplace平滑:(a=1时)
三、Bernoulli NB
原型
class sklearn.naive_bayes.
BernoulliNB
(alpha=1.0, binarize=0.0, fit_prior=True, class_prior=None)
假设特征的似然满足多元Bernoulli分布,每个特征是一个二值变量
Bernoulli NB判别准则满足:
区别于Multinomial NB
有文献证明,在短文本分类上Bernoulli NB可能优于Multinomial NB