第四课:模型补充
朴素贝叶斯分类
【实例】朴素贝叶斯实例
作者 : 老饼 日期 : 2022-06-27 22:36:14 更新 : 2022-09-27 17:12:29
本站原创文章,转载请说明来自《老饼讲解-机器学习》ml.bbbdata.com


本文展示一个朴素贝叶斯的具体计算实例,通

过本实例,更具体的了解朴素贝叶素的使用。


  01. 问题  


  数据  


历史身高、体重与性别的历史数据:
 



  问题  


现在来了个身高分组为3,体重分组为2的,
需要如何判断该样本的类别。




  02. 朴素贝叶斯判断过程  


   思路   


朴素贝叶斯就是以历史数据作为依据,
判断新样本属于各类别的概率,
最后属于哪个类别的概率较大,
就判为属于哪一类。


  具体判断过程  



1、估算各类别下特征表现的概率


P(身高=3|已知属于男) = 男样本中身高分组为3的个数 / 男样本个数 = 1/3   
P(体重=2|已知属于男) = 男样本中体重分组为2的个数 / 男样本个数 = 1/3   
P(身高=3|已知属于女) = 女样本中身高分组为3的个数 / 女样本个数 =  1/4  
P(体重=2|已知属于女) = 女样本中体重分组为2的个数 / 女样本个数 =  2/4  


2、估算属于各类别的先验概率(即类别占比)


P(属于男) = 
P(属于女) =  


3、 估算特征表现概率(即特征占比)


P(身高=3) = 身高为分组3的占比 = 
P(体重=2) = 体重为分组2的占比 = 


4、计算样本属于各类别的概率值(或判别值)




5、结论


是男的概率为  ,是女的概率为,由此,判断样本属于女。

备注:特征占比在实际计算中不需计算,因为最后是比较大小,分母不必计算。




  End  







联系小饼