本站原创文章,转载请说明来自《老饼讲解-机器学习》ml.bbbdata.com
本文介绍学习机器学习所需要学习的具体内容
所需学习内容类别
这里我们并不考虑机器学习学术上的知识体系和完整性,
而是描述实际应用中的使用体系、知名度和性价比
需要学习的内容分为
👉 模型(算法)
👉 求解算法
👉 综合知识
其中,模型/算法是指最终所需使用的对象,
而求解算法是服务于模型的,求解模型所需的参数
综合知识则是根据具体实践项目,灵活性补充的相关知识
本节列举一些重要的、具体的学习知识内容
01. 模型(算法)
模型非常多,下面列举一些知名度较高的模型,
也可以认为是常见的Base模型
系列模型
线性回归-->逻辑回归-->SVM
决策树-->集成算法(随机森林、Adboost、GBDT)-->Xgboost
PCA-->LDA-->FA-->ICA(该系列通常用于降维)
线性回归-->岭回归-->Lasso回归
散装模型
KNN、K-means、朴素贝叶斯、隐马可夫链、Apriori
✍️说明
(1)标红的是必学的模型
(2)系列模型是指这些模型是相关的,学习时按顺序递进式学习
散装模型则是独立的,没有依赖,独立学习即可
02. 求解算法
1、精确求解:线性方程最小二乘求解
2、基于微分的优化算法:梯度下降、牛顿法与拟牛顿法、共轭梯度法
3、*启发式智能算法:模拟退火、遗传算法、蚁群算法
加*的代表该系列优先度不高
03. 综合知识
常见的有:过拟合、正则化、数据清洗、AUC、KS等等
综合知识往往是在学习模型或实践中慢慢积累而成,不需特地专门去学习
这里只是把较具代表性的列出来,能搞完上面这些,已经不错了
事实上,上面的内容并不会要求全部学完
一般先学一部分,再按具体工作所需进行补充学习即可
End