本文主要是介绍年货系列5-【转载】机器学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本文是小小挖掘机2020年货的第五篇,主要回顾一下2019年转载的机器学习相关的文章。后续还会有更多的年货送给大家,希望大家持续关注呦~。首先感谢以下公众号提供的支持:
年货系列回顾:
年货系列1-【原创】推荐系统遇上深度学习系列
年货系列2-【原创】其他原创汇总
年货系列3-【转载】推荐系统相关
年货系列4-【转载】数据分析及处理&特征工程
本文将从机器学习资源、机器学习基础、机器学习实战等三部分展开。
1、机器学习资源
想要入门机器学习,书籍的话首推李航博士的《统计学习方法》,下面两篇分别整理了第一版的学习笔记和第二版的课件:
《统计学习方法》 ( 李航 ) 读书笔记
李航《统计学习方法》第 2 版发布完整课件!清华教授出品!附完整下载
视频也是一种很好的学习方式,推荐李宏毅老师的机器学习课程:
《李宏毅机器学习完整笔记》发布,Datawhale开源项目LeeML-Notes
而下面一篇文章是一篇不错的机器学习入门教程,推荐给大家:
80页笔记看遍机器学习基本概念、算法、模型,帮新手少走弯路
除此之外,下面几篇文章总结了机器学习教程以及资源:
强烈推荐10 个机器学习教程!(含视频链接)
完备的机器学习资源:书、视频、源码,都汇总在这份清单里!
干货!最全的AI速查表|神经网络,机器学习,深度学习
最后,机器学习的学习也离不开论文的阅读,下面推荐三个常见的论文搜索网站,分别是arXiv、NIPS、paperswithcode,当然我个人经常使用的还有dblp。
推荐三款机器学习论文搜索利器
2、机器学习基础
下面的一些文章,带你入门或复习一些基础的机器学习算法和定理,如逻辑回归LR、SVM、K-means聚类、LDA等降维算法等
万字干货|逻辑回归最详尽解释
数据挖掘知识点串烧:SVM
详解机器学习中的熵、条件熵、相对熵、交叉熵
最直白的熵、交叉熵和 KL 散度教程
一文详尽解释K-means算法
通俗理解一个常用的降维算法
基于 Python 的 11 种经典数据降维算法
机器学习与深度学习核心知识点总结
机器学习常见算法优缺点总结!
机器学习中非常有名的理论或定理你知道几个?
这里我们单拎出XGBoost,这个模型实在是太重要了,相比于上述的算法,其在面试中被提问的概率更高,下面几篇文章对于深入理解XGBoost一定会有帮助:
【推荐收藏】带你撸一遍 XGBoost论文
XGBoost超详细推导,终于有人讲明白了!
终于有人把XGBoost 和 LightGBM 讲明白了,项目中最主流的集成算法!
XGBoost缺失值引发的问题及其深度分析
而对于机器学习的评估,我们需要了解常用的评估指标和损失函数,如分类问题中的精确率、召回率、F1值、AUC、交叉熵损失等,回归问题中的MAE、MSE等:
机器学习中常用的5种回归损失函数,你都用过吗?
机器学习中的 7 大损失函数实战总结(附Python演练)
【机器学习】一文详尽介绍模型评估指标
在机器学习中,我们经常遇到类别不平衡的问题,类别不平衡问题并非简简单单的各类别数据数量上具有差异,更需要从数据分布上进行详细分析。下面两篇文章解释了什么是数据不平衡问题以及对应的解决方法:
极端类别不平衡数据下的分类问题研究综述 | 硬货
使用一个特别设计的损失来处理类别不均衡的数据集
机器学习中另一个问题是可解释性模型可解释性指对模型内部机制的理解以及对模型结果的理解,机器学习模型的可解释性越高,人们就越容易理解为什么做出某些决定或预测。比如在推荐系统中,我们不仅要知道给用户推荐什么物品,更需要知道为什么给用户推荐这个物品。下文对机器学习模型可解释性做了详尽介绍:
机器学习模型可解释性的详尽介绍
最后是数学相关的问题,个人感觉数学在工作中的作用并不大,但是学好数学对于理解机器学习算法很有帮助:
11种概率分布,你了解几个?
线性代数在数据科学中的十个强大应用(一)
线性代数在数据科学中的十大强大应用(二)
学机器学习有必要懂数学吗?深入浅出机器学习与数学的关系
3、机器学习实战
最后是一些机器学习实战相关的文章,包括机器学习模型的部署和调优相关的经验、算法工程师在岗工作的经验等等:
《美团机器学习实践》—— 思维导图
陈天奇:机器学习科研的十年
一文介绍机器学习模型调优的"解题思路"
为什么机器学习部署起来这么难?
为什么机器学习模型在生产中会退化?
机器学习最有价值的6个经验教训
算法在岗一年的经验总结
新手机器学习工程师最容易犯的错误Top6
模型的独立学习方式
这篇关于年货系列5-【转载】机器学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!