第一课:初探模型
机器学习初探
【小例】机器学习模型小例
作者 : 老饼 日期 : 2022-06-26 22:15:33 更新 : 2022-11-28 16:02:53
本站原创文章,转载请说明来自《老饼讲解-机器学习》ml.bbbdata.com


本文,我们通过一个简单的、不严谨的小例,

大概地了解一下机器学习是怎么用模型解决问题的。



  问题  


机器学习的主要任务是就是进行预测,例如如下问题
 
 
 我们有一组年龄与身高的数据
我们希望通过年龄预测身高

 
下面,我们看看机器学习是如何解决这个问题的





  01.数据探索  


本节,我们先对数据进行初步探索(Exploratory Data Analysis),了解数据特性


   了解数据特性   


把x,y画在坐标轴上如下:
 
可以发现,身高和年龄是有强烈的线性关系的





  02. 模型思想  


下面我们看看机器学习是如何建立模型来进行预测的


  选择模型  


由于身高与年龄有强列的线性关系
我们可以假设它们的关系是 。 




  确定模型参数  


损失函数
在确定使用线性模型
就需要确定其中的参数[w,b]
那么,我们需要的[w,b]应该是什么样的呢?
在这里,我们希望[w,b]能令模型预测的结果与实际结果越接近越好
不妨用所有预测样本的误差平方和作为误差的衡量指标
如下
 
这个用于引导我们求解w,b的函数E,称为模型的 损失函数
注意,损失函数是关于w,b的函数,即设置不同的w,b,就会有不同的误差
损失函数的求解
通过求取令E最小时的[w,b], 
就能确定最适合我们用来拟合数据点的直线。
实际就是求w,b取何值时,能令E 最小的数学问题。

如下,令E的偏导数(即分别对w,b求导,多元函数称为偏导,用   符号表示)都为0,
即可联立解得令E最小的w,b。


两个线性方程 ,两个未知数,联立求解即可得到w,b。




  03. 模型评估  


本节我们介绍模型的评估


    模型评估指标   


在求出模型中的参数w,b后,也就是得到了最终的模型之后,
我们还需要评估模型的效果
这个例子中,我们可以仍然可以使用误差平方和来作为我们最终对模型质量的评估:

当然,我们也可以使用其它函数,具体问题可以具体定义,它指向了模型投入使用时的价值(或者损失)
👉 辨析:模型评估指标与损失函数的异同
模型评估指标与损失函数都一样用于评估模型的质量,
但损失函数是面向求解的,
而模型评估指标则面向最后的评估,
初听可能觉得两者一样,其实不一样,
因为损失函数是面向求解的,要求虑到求解的难度等问题,
而模型评估指标则可以更灵活,只需考虑如何评估模型在业务中的效果更为合理就可以





 End 






联系老饼