（imooc）初识机器学习—理论篇

2023-12-28 19:58

文章标签 初识学习机器理论 imooc

本文主要是介绍（imooc）初识机器学习—理论篇，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

机器学习

image.png

从数据中寻找规律

image.png

*传统统计学方法：
抽样——描述统计——假设检验
*现代机器学习：
从全量中寻找规律

image.png

image.png

机器学习发展

image.png

业务系统发展

image.png

机器学习：
离线机器学习：
缺点：例如电商的某些节日大促销，爆发大量推荐订单等
解决可以用实时模型实时推荐，即在线学习

机器学习典型应用

关联原则

image.png

聚类

image.png

朴素贝叶斯和决策树

image.png

image.png

ctr预估和协同过滤

image.png

image.png

自然语言处理和图像识别

image.png

image.png

image.png

image.png

机器学习和数据分析的区别

image.png

交易数据

image.png

行为数据

image.png

image.png

机器学习算法分类

算法分类（1）

有监督学习

*无监督学习
eg 聚类算法

*半监督学习

算法分类（2）

根据要解决的问题进行分类

分类与回归
预测y值，针对具体问题
聚类
标注

image.png

算法分类（3）（重要）

生成模型
（像是陪审团）告诉它属于各个类的概率等，结果模棱两可。
判别模型
直接给一个函数，丢一个数据返回结果告诉你哪一类，直指最终目的（像是大法官告诉你是哪一类）

本质区别在于训练数据的思想不同

image.png

c4.5 cart属于决策树算法，解决分类问题
k—means 聚类，像是电信用户的分类。无监督学习的算法
svm分类算法，基于统计学的算法，有一套完整数学理论支撑，有一定数学门槛（被深度学习光芒盖住）（机器学习面试可能会考）
aprior 关联分析（淘汰），代价高，需要多次访问数据库
同样，PF-growth 解决关联规则问题解决aprior的性能问题。只需要对数据库两边扫描就可以完成数据挖掘，（现在推荐系统有了更多的推荐算法）
PageRank谷歌的算法
Adaboost 常用于人脸识别，本质为决策树，本质解决分类问题（有监督学习）
KNN 有监督学习
朴素贝叶斯垃圾邮件识别

image.png

逻辑回归：百度谷歌搜索结果的排序
RF，GDBT 同adaboost 决策树算法的改进
推荐算法
LDA 用做文本分析与自然语言处理
WORD2vector 文本挖掘，最终是一个结果，里面用到一系列算法
深度学习：可用于图像识别等等

机器学习解决问题框架

确定目标
业务需求
数据
特征工程（重要）
训练模型
定义模型

image.png

定义损失函数
eg。做线性回归模型，没有精确解的时候找一个近似
优化算法
eg 让损失函数更小
求函数极小值的优化上，数学问题

模型评估
交叉评估：
效果评估：

图片识别demo演示

image.png

rgb转hsl抽取特征

image.png

把图片转换为向量vector

这篇关于（imooc）初识机器学习—理论篇的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/547109。 23002807@qq.com

相关文章

Java进阶学习之如何开启远程调式

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,：本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

阅读更多...

Java深度学习库DJL实现Python的NumPy方式

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

阅读更多...

HarmonyOS学习(七)——UI（五）常用布局总结

HarmonyOS学习(七)——UI（五）常用布局总结

自适应布局 1.1、线性布局（LinearLayout）通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列，Row组件中的子组件按照水平方向排列。属性说明space通过space参数设置主轴上子组件的间距，达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式，且在各类尺寸屏幕上表现一致，其中交叉轴为垂直时，取值为Vert

阅读更多...

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya（不是本人，claude AI）在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。以下是详细的内容：提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

阅读更多...

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画（下）

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画（下）

【课程链接】 AntV G6：深入图形与图形分组、自定义节点、节点动画（下）_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中，应该怎样去计算和绘制图形，如何给一个图形制作不间断的动画，以及在鼠标事件之后产生动画。（有点难，需要好好理解） <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

阅读更多...

学习hash总结

学习hash总结

2014/1/29/ 最近刚开始学hash，名字很陌生，但是hash的思想却很熟悉，以前早就做过此类的题，但是不知道这就是hash思想而已，说白了hash就是一个映射，往往灵活利用数组的下标来实现算法，hash的作用：1、判重；2、统计次数；

阅读更多...

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

题库来源：安全生产模拟考试一点通公众号小程序 2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题是由安全生产模拟考试一点通提供，流动式起重机司机证模拟考试题库是根据流动式起重机司机最新版教材，流动式起重机司机大纲整理而成（含2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题参考答案和部分工种参考解析），掌握本资料和学校方法，考试容易。流动式起重机司机考试技

阅读更多...

零基础学习Redis(10) -- zset类型命令使用

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合，内部除了存储元素外，还会存储一个score，存储在zset中的元素会按照score的大小升序排列，不同元素的score可以重复，score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd zadd key [NX | XX] [GT | LT] [CH] [INCR] score member [score member ...]

阅读更多...

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言高斯过程（Gaussian Process，简称GP）是一种概率模型，用于描述一组随机变量的联合概率分布，其中任何一个有限维度的子集都具有高斯分布文章目录引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数（或核函数） 1.3 核函数1.4 高斯过程回归（Gauss

阅读更多...

【学习笔记】陈强-机器学习-Python-Ch15 人工神经网络（1）sklearn

【学习笔记】陈强-机器学习-Python-Ch15 人工神经网络（1）sklearn

系列文章目录监督学习：参数方法【学习笔记】陈强-机器学习-Python-Ch4 线性回归【学习笔记】陈强-机器学习-Python-Ch5 逻辑回归【课后题练习】陈强-机器学习-Python-Ch5 逻辑回归（SAheart.csv）【学习笔记】陈强-机器学习-Python-Ch6 多项逻辑回归【学习笔记及课后题练习】陈强-机器学习-Python-Ch7 判别分析【学

阅读更多...