第四课:模型补充
朴素贝叶斯分类
【补充】朴素贝叶斯概念补充
作者 : 老饼 日期 : 2022-06-27 20:08:42 更新 : 2022-09-27 17:12:45
本站原创文章,转载请说明来自《老饼讲解-机器学习》ml.bbbdata.com



本文补充一些朴素贝叶斯模型相关的概念,

通过这些概念的理解,加深对朴素贝叶斯模型的理解。


   01. 贝叶斯原理、贝叶斯分类器与朴素贝叶斯的区别   


  贝叶斯原理  、 贝叶斯分类器 、朴素贝叶斯 这几个概念很容易混淆,
非常有必要将它的区别梳理一下。



  贝叶斯原理   

 
    指的是贝叶斯的后验公式。 

 
  贝叶斯分类器    

指用贝叶斯后验公式建立的分类器。

 
  朴素贝叶斯    

在贝叶斯分类器的基础上,添加了“变量间独立”的假设条件。

 




  02. 先验概率、后验概率、信息证据  


为方便查看,再次贴上贝叶斯原理公式:




  先验概率  


先验概率是指,事情未发生,利用以往经验,对未来预测。
例如,贝叶斯原理中的P(属于类别i) 就是先验概率,
它利用之前的类别信息,估算新样本所属类别的概率。


   后验概率  


后验概率是指,事情已经发生,执果寻因,用结果倒推原因的概率。
例如,病人已病,在咳嗽,求病人咳嗽是由风寒引起的概率,这就是后验概率。
贝叶斯原理中的 P(属于类别i|已知表现为x特征) 就是后验概率。


  信息证据  


信息证据是一个重要、常见的概念。

我们往往不能直接观察到目标信息y(例如样本的类别),
但我们可以观察到y的一些关联信息x(例如样本的特征),

如果不借用X的信息,我们只能根据以往y的分布进行估算新样本的概率。
但是,当我们掌握了信息X,
我们就可以根据X去补充、修正原先的预测概率,使预测更加准确,
假设X=[x1,x2....xn],每掌握多一个xi,都能让我们把概率修正得更准确,
X里包含的每个xi也就成了我们判断y的信息证据。







 End 









联系小饼