【思维导图,表格】【熟记】机器学习算法集锦:从贝叶斯到深度学习及各自优缺点

本文主要是介绍【思维导图,表格】【熟记】机器学习算法集锦:从贝叶斯到深度学习及各自优缺点,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

本文是这篇文章的阅读笔记

https://static.coggle.it/diagram/WHeBqDIrJRk-kDDY

英文思维导图链接

机器学习算法集锦:从贝叶斯到深度学习及各自优缺点• 正则化算法
(Regularization Algorithms)
[http://cdn2.processon.com/60c72458e4b0931a1b106d4b?e=1623667304&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:K7kFiN7J86Zi9q0LEcZDdHpV31g=]
 它是另一种方法(通常是回归方法)的拓展,
这种方法会基于模型复杂性对其进行惩罚,
它喜欢相对简单能够更好的泛化的模型。 
 
例子: • 岭回归(Ridge Regression)
 • 最小绝对收缩与选择算子(LASSO)
 • GLASSO
 • 弹性网络(Elastic Net)
 • 最小角回归(Least-Angle Regression)
 优点: • 其惩罚会减少过拟合
 • 总会有解决方法
 缺点: • 惩罚会造成欠拟合
很难校准
 • 集成算法
(Ensemble Algorithms)

 
集成方法是由多个较弱的模型集成模型组,其中的模型可以单独进行训练,
并且它们的预测能以某种方式结合起来去做出一个总体预测。 
 
该算法主要的问题是要找出哪些较弱的模型可以结合起来,以及结合的方法。 
这是一个非常强大的技术集,因此广受欢迎。 
例子 • Boosting
 • Bootstrapped Aggregation(Bagging)
 • AdaBoost
 • 层叠泛化(Stacked Generalization)(blending)
 • 梯度推进机(Gradient Boosting Machines,GBM)
 • 梯度提升回归树(Gradient Boosted Regression Trees,GBRT)
 • 随机森林(Random Forest)
 优点: • 当先最先进的预测几乎都使用了算法集成。
它比使用单个模型预测出来的结果要精确的多
 缺点:需要大量的维护工作
 • 决策树算法
(Decision Tree Algorithm)
[http://cdn2.processon.com/60c7260be4b0931a1b1076ad?e=1623667739&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:ACH8_e0UxHpm3aXSTFwngJ27asU=]
决策树学习使用一个决策树作为一个预测模型,
它将对一个 item(表征在分支上)观察所得映射成关于该 item 的目标值的结论(表征在叶子中)。
 树模型中的目标是可变的,可以采一组有限值,被称为分类树;
在这些树结构中,叶子表示类标签,分支表示表征这些类标签的连接的特征。
 
例子: • 分类和回归树(Classification and Regression Tree,CART)
 • Iterative Dichotomiser 3(ID3)
 • C4.5 和 C5.0(一种强大方法的两个不同版本)
 优点: • 容易解释
 • 非参数型
 缺点: • 趋向过拟合
 • 可能或陷于局部最小值中
 • 没有在线学习
 • 回归
(Regression)
[http://cdn2.processon.com/60c72602e4b07e26e6b99f61?e=1623667730&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:oZQKUvA16mEu2DXQ02fRXNYMcEc=]
回归是用于估计两种变量之间关系的统计过程。 
当用于分析因变量和一个 多个自变量之间的关系时,该算法能提供很多建模和分析多个变量的技巧。 
具体一点说,回归分析可以帮助我们理解当任意一个自变量变化,另一个自变量不变时,因变量变化的典型值。 
最常见的是,回归分析能在给定自变量的条件下估计出因变量的条件期望。 
 回归算法是统计学中的主要算法,它已被纳入统计机器学习。 
 例子: • 普通最小二乘回归(Ordinary Least Squares Regression,OLSR)
 • 线性回归(Linear Regression)
 • 逻辑回归(Logistic Regression)
 • 逐步回归(Stepwise Regression)
 • 多元自适应回归样条(Multivariate Adaptive Regression Splines,MARS)
 • 本地散点平滑估计(Locally Estimated Scatterplot Smoothing,LOESS)
 优点: • 直接、快速
 • 知名度高
 缺点: • 要求严格的假设
 • 需要处理异常值
 • 人工神经网络
(Artificial Neural Network)
[http://cdn2.processon.com/60c72684e4b0931a1b107723?e=1623667860&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:RH0zhw3JucGaUdA__XCngcdPiWI=]
人工神经网络是受生物神经网络启发而构建的算法模型。  
它是一种模式匹配,常被用于回归和分类问题,但拥有庞大的子域,由数百种算法和各类问题的变体组成。
例子: • 感知器
 • 反向传播
 • Hopfield 网络
 • 径向基函数网络(Radial Basis Function Network,RBFN)
 优点: • 在语音、语义、视觉、各类游戏(如围棋)的任务中表现极好。
 • 算法可以快速调整,适应新的问题。
 缺点: • 需要大量数据进行训练
 • 训练要求很高的硬件配置
 • 模型处于「黑箱状态」,难以理解内部机制
 • 元参数(Metaparameter)与网络拓扑选择困难。
 • 深度学习
(Deep Learning)
[http://cdn2.processon.com/60c726f4e4b07e26e6b9a000?e=1623667972&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:l51A5R37RnCqOfFmVnGrtnBKy-4=]
深度学习是人工神经网络的最新分支,它受益于当代硬件的快速发展。 
 众多研究者目前的方向主要集中于构建更大、更复杂的神经网络,
目前有许多方法正在聚焦半监督学习问题,其中用于训练的大数据集只包含很少的标记。
 
 例子: • 深玻耳兹曼机(Deep Boltzmann Machine,DBM)
 • Deep Belief Networks(DBN)
 • 卷积神经网络(CNN)
 • Stacked Auto-Encoders
 优点/缺点:见神经网络 
 • 支持向量机
(Support Vector Machine)
[http://cdn2.processon.com/60c7271fe4b0a041c488e4ec?e=1623668015&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:4ZMcZGJKOAzYy7QR-CYEcxRiRc8=]
给定一组训练事例,其中每个事例都属于两个类别中的一个,
支持向量机(SVM)训练算法可以在被输入新的事例后将其分类到两个类别中的一个,使自身成为非概率二进制线性分类器。
 
 SVM 模型将训练事例表示为空间中的点,它们被映射到一幅图中,由一条明确的、尽可能宽的间隔分开以区分两个类别。 
 随后,新的示例会被映射到同一空间中,并基于它们落在间隔的哪一侧来预测它属于的类别。 
 优点: • 在非线性可分问题上表现优秀
 缺点: • 非常难以训练
 • 很难解释
 • 降维算法
(Dimensionality Reduction Algorithms)
[http://cdn2.processon.com/60c7276fe4b0a35e825167fd?e=1623668095&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:yato1r1lEd7g_fKcxj77kw7aocg=]
和集簇方法类似,降维追求并利用数据的内在结构,目的在于使用较少的信息总结或描述数据。 
 这一算法可用于可视化高维数据或简化接下来可用于监督学习中的数据。 
许多这样的方法可针对分类和回归的使用进行调整。 
 例子: • 主成分分析(Principal Component Analysis (PCA))
 • 主成分回归(Principal Component Regression (PCR))
 • 偏最小二乘回归(Partial Least Squares Regression (PLSR))
 • Sammon 映射(Sammon Mapping)
 • 多维尺度变换(Multidimensional Scaling (MDS))
 • 投影寻踪(Projection Pursuit)
 • 线性判别分析(Linear Discriminant Analysis (LDA))
 • 混合判别分析(Mixture Discriminant Analysis (MDA))
 • 二次判别分析(Quadratic Discriminant Analysis (QDA))
 • 灵活判别分析(Flexible Discriminant Analysis (FDA))
 优点: • 可处理大规模数据集
 • 无需在数据上进行假设
 缺点: • 难以搞定非线性数据
 • 难以理解结果的意义
 • 聚类算法
(Clustering Algorithms)
[http://cdn2.processon.com/60c73264e4b0e4e9f3ea61ff?e=1623670900&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:lzqDJk42zpNhFT5cIRK7IXnR7hw=]
聚类算法是指对一组目标进行分类,属于同一组(亦即一个类,cluster)的目标被划分在一组中,
与其他组目标相比,同一组目标更加彼此相似(在某种意义上)。
 
 例子: • K-均值(k-Means)
 • k-Medians 算法
 • Expectation Maximi 封层 ation (EM)
 • 最大期望算法(EM)
 • 分层集群(Hierarchical Clstering)
  
 优点: • 让数据变得有意义
 缺点:结果难以解读,针对不寻常的数据组,结果可能无用。
 • 基于实例的算法
(Instance-based Algorithms)
[http://cdn2.processon.com/60c73389e4b03c44a169da1b?e=1623671193&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:CXU10zDdI45fCf17aOecgkDcj84=]
基于实例的算法(有时也称为基于记忆的学习)是这样学 习算法,
不是明确归纳,而是将新的问题例子与训练过程中见过的例子进行对比,
这些见过的例子就在存储器中。
 
 之所以叫基于实例的算法是因为它直接从训练实例中建构出假设。 
这意味这,假设的复杂度能随着数据的增长而变化: 
最糟的情况是,假设是一个训练项目列表,分类一个单独新实例计算复杂度为 O(n) 
 例子: • K 最近邻(k-Nearest Neighbor (kNN))
 • 学习向量量化(Learning Vector Quantization (LVQ))
 • 自组织映射(Self-Organizing Map (SOM))
 • 局部加权学习(Locally Weighted Learning (LWL))
 优点: • 算法简单、结果易于解读
 缺点: • 内存使用非常高
 • 计算成本高
不可能用于高维特征空间
 • 贝叶斯算法
(Bayesian Algorithms)
[http://cdn2.processon.com/60c733c0e4b0a35e82517464?e=1623671248&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:i_9A7HipS1KoHFXq1nGicJQXTW0=]
贝叶斯方法是指明确应用了贝叶斯定理来解决如分类和回归等问题的方法。 
 例子: • 朴素贝叶斯(Naive Bayes)
 • 高斯朴素贝叶斯(Gaussian Naive Bayes)
 • 多项式朴素贝叶斯(Multinomial Naive Bayes)
 • 平均一致依赖估计器(Averaged One-Dependence Estimators (AODE))
 • 贝叶斯信念网络(Bayesian Belief Network (BBN))
 • 贝叶斯网络(Bayesian Network (BN))
 优点: • 快速、易于训练、给出了它们所需的资源能带来良好的表现
 缺点: • 如果输入变量是相关的,则会出现问题
 • 关联规则学习算法
(Association Rule Learning Algorithms)
[http://cdn2.processon.com/60c7342de4b0975665eab5a4?e=1623671357&token=trhI0BY8QfVrIGn9nENop6JAc6l5nZuxhjQ62UfM:2eIveLDcR4PM8CLCPFYfnFjCUig=]
关联规则学习方法能够提取出对数据中的变量之间的关系的最佳解释。 
比如说一家超市的销售数据中存在规则 {洋葱,土豆}=> {汉堡},
那说明当一位客户同时购买了洋葱和土豆的时候,他很有可能还会购买汉堡肉。
 
 例子: • Apriori 算法(Apriori algorithm)
 • Eclat 算法(Eclat algorithm)
 • FP-growth
• 图模型
(Graphical Models)
图模型或概率图模型(PGM/probabilistic graphical model)是一种概率模型, 
一个图(graph)可以通过其表示随机变量之间的条件依赖结构(conditional dependence structure)。 
 例子: • 贝叶斯网络(Bayesian network)
 • 马尔可夫随机域(Markov random field)
 • 链图(Chain Graphs)
 • 祖先图(Ancestral graph)
 优点: • 模型清晰,能被直观地理解
 缺点: • 确定其依赖的拓扑很困难,有时候也很模糊

这篇关于【思维导图,表格】【熟记】机器学习算法集锦:从贝叶斯到深度学习及各自优缺点的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/524478

相关文章

SpringCloud动态配置注解@RefreshScope与@Component的深度解析

《SpringCloud动态配置注解@RefreshScope与@Component的深度解析》在现代微服务架构中,动态配置管理是一个关键需求,本文将为大家介绍SpringCloud中相关的注解@Re... 目录引言1. @RefreshScope 的作用与原理1.1 什么是 @RefreshScope1.

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

利用Python开发Markdown表格结构转换为Excel工具

《利用Python开发Markdown表格结构转换为Excel工具》在数据管理和文档编写过程中,我们经常使用Markdown来记录表格数据,但它没有Excel使用方便,所以本文将使用Python编写一... 目录1.完整代码2. 项目概述3. 代码解析3.1 依赖库3.2 GUI 设计3.3 解析 Mark

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

python中字符串拼接的几种方法及优缺点对比详解

《python中字符串拼接的几种方法及优缺点对比详解》在Python中,字符串拼接是常见的操作,Python提供了多种方法来拼接字符串,每种方法有其优缺点和适用场景,以下是几种常见的字符串拼接方法,需... 目录1. 使用 + 运算符示例:优缺点:2. 使用&nbsjsp;join() 方法示例:优缺点:3

Redis中高并发读写性能的深度解析与优化

《Redis中高并发读写性能的深度解析与优化》Redis作为一款高性能的内存数据库,广泛应用于缓存、消息队列、实时统计等场景,本文将深入探讨Redis的读写并发能力,感兴趣的小伙伴可以了解下... 目录引言一、Redis 并发能力概述1.1 Redis 的读写性能1.2 影响 Redis 并发能力的因素二、

Java利用poi实现word表格转excel

《Java利用poi实现word表格转excel》这篇文章主要为大家详细介绍了Java如何利用poi实现word表格转excel,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 一、每行对象类需要针对不同的表格进行对应的创建。package org.example.wordToEx

最新Spring Security实战教程之表单登录定制到处理逻辑的深度改造(最新推荐)

《最新SpringSecurity实战教程之表单登录定制到处理逻辑的深度改造(最新推荐)》本章节介绍了如何通过SpringSecurity实现从配置自定义登录页面、表单登录处理逻辑的配置,并简单模拟... 目录前言改造准备开始登录页改造自定义用户名密码登陆成功失败跳转问题自定义登出前后端分离适配方案结语前言

使用EasyExcel实现简单的Excel表格解析操作

《使用EasyExcel实现简单的Excel表格解析操作》:本文主要介绍如何使用EasyExcel完成简单的表格解析操作,同时实现了大量数据情况下数据的分次批量入库,并记录每条数据入库的状态,感兴... 目录前言固定模板及表数据格式的解析实现Excel模板内容对应的实体类实现AnalysisEventLis