【西瓜书】1.绪论

2024-06-05 00:04
文章标签 绪论 西瓜

本文主要是介绍【西瓜书】1.绪论,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.基本术语

(1)数据集不带最后一列:样本/示例/特征向量

        带最后一列:样例

(2)表头不带最后一列:属性/特征,属性空间/特征空间/样本空间/输入空间

         表头最后一列:标记/输出,标记空间/输出空间

(3)训练集:训练示例、训练样本、训练例

         测试集:测试示例、测试样本、测试例

(4)学习任务:分类(二分类/多分类)、回归、聚类

          分类和回归为监督学习,聚类为无监督学习

2.假设空间

(1)归纳:特殊到一般(泛化)

        演绎:一般到特殊(特化)

(2)从样例中学习是归纳学习

(3)假设空间样本空间标记空间的映射,是属性所有可能的取值组合构成的空间

(4)假设空间大小:sum(属性的取值数+1)+1,第一个+1表示取通配符*,第二个+1表示∅这种极端情况

(5)搜索假设空间:自顶向下(一般到特殊)、自底向上(特殊到一般)

        搜索过程中删除和正例不一致的假设

(6)假设空间的子集中,与训练集一致的空间的集合为版本空间,版本空间中的所有树都能将所有样本判断正确。版本空间包含了所有可能的决策树,这些决策树能够完美地对训练集进行分类,即没有误分类的样本。

3.归纳偏好

(1)版本空间中不同的模型在训练集上表现一致,选哪个去预测测试集?

(2)根据偏好选择比如特殊的、一般的、或根据领域知识决定某个属性取某某的(与特征选择不同)。

(3)原则:奥卡姆剃刀(选简单的平滑的)、没有免费的午餐(具体问题具体分析)

这篇关于【西瓜书】1.绪论的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1031506

相关文章

数据结构(C语言版)-第一章绪论

1.1 什么是数据结构 数据结构是计算机科学中一个核心概念,它涉及到如何在计算机中有效地存储、组织和管理数据。数据结构的选择和设计直接影响到算法的效率和程序的性能。其基本要素包括数据元素(也称为节点或记录)、数据元素之间的关系,以及在此基础上定义的各种操作。 具体来说,数据结构可以分为以下几个关键方面: 逻辑结构:这是对数据元素之间逻辑关系的抽象描述,不依赖于数据在计算机中的实际存储方式。逻辑

数据结构_绪论

1.数据结构的研究内容 研究数据的特性和数据之间的关系  用计算机解决一个问题的步骤 1.具体问题抽象成数学模型 实质: 分析问题--->提取操作对象--->找出操作对象之间的关系(数据结构)--->用数学语言描述 操作对象+对象之间的关系 2.设计算法 3.编程,调试,运行 早期计算机主要用于计算数值计算(数据对象关系简单,但计算复杂) 例: 求解梁架结构的应力(线性方

数据结构与算法 绪论

计算机的处理数据能力是是计算机解决各种实际问题的基础,但是现实世界大众的实现问题必须经过抽象,得出反映世纪食物本质的数据表示后才可以被计算机处理。数据结构课程主要研究的问题就是将这些数据以及他们之间的关系存储到计算机中,再用有效的的方法去处理这些数据。     问题求解的四个阶段:分析阶段、设计阶段(数据结构+算法)、编码阶段、测试和维护阶段;        数据结构的分类:

【西瓜书】第一二章笔记

耽于学业,选择速记,后续再补。本笔记质量不高,敬请谅解。 关键词: 监督学习(Supervised Learning):一种机器学习范式,其中模型在带有标签的数据集上进行训练。标签提供了正确的答案,算法通过对比预测结果与实际标签,调整模型参数以最小化误差。监督学习主要包括分类和回归两种任务。 模型(Model):在机器学习中,模型是用来表示输入数据与输出结果之间关系的数学结构。模型可

软件测试-第1章-绪论

目录 1.1软件危机和软件生存期 (1)软件危机 (2)软件生存周期 1.2软件测试的意义 1.3什么是软件测试 (1)软件测试的定义 (2)软件测试的范围 1.4怎样认识软件测试 1.测试的基本原则 2.证实程序的正确性是测试的目的吗 3.测试的局限性 4.程序验证方法能否取代测试问题 5.软件测试信息流 1.5软件测试发展的历史回顾 1.历史回顾 2.与软件测试

东明第19届西瓜节背后的秘密

中共东明县委书记孙迁国致辞 6月16日,随着华灯初上,东明县小井镇沉浸在一片欢乐祥和的氛围中。备受瞩目的第十九届西瓜节在这里盛大开幕,数万观众汇聚一堂,共同见证了东明县以西瓜为纽带,连接传统与现代、文化与经济的甜蜜盛事。 开幕式现场气氛热烈而喜庆。活动邀请了众多知名歌手演员,其中梦然、甘苹和周晓鸥等艺人的精彩表演赢得了观众的阵阵掌声和喝彩声。相声、舞蹈、戏曲等多

【高频电子电路】第一章 绪论

目录 通信系统组成 无线电发送和接收设备 无线电发送设备 无线电接收设备 调制的作用 任务四:高频电子线路的研究对象 通信系统组成 无线电发送和接收设备 无线电发送设备 无线电接收设备 调制的作用 幅度调制(AM) 频率调制(FM) 相位调制(PM) 补充 高频电子线路的研究对象

类别朴素贝叶斯CategoricalNB和西瓜数据集

CategoricalNB 1 CategoricalNB原理以及用法2 数据集2.1 西瓜数据集2.2 LabelEncoder2.3 OrdinalEncoder 3 代码实现 1 CategoricalNB原理以及用法 (1)具体原理 具体原理可看:贝叶斯分类器原理 sklearn之CategoricalNB对条件概率的原理如下: P ( x i = k ∣ y ) =

实验室新生成长指南[0]·绪论

实验室新生成长指南是新开的一个系列。笔者在实验室带新生的过程中,发现很多新人进入实验室时手足无措,面对学长的任务存在着诸如:不知道怎么学,不知道去哪学以及更为关键的思维方式的转变无法快速的形成。这一方面使得新生劝退率居高不下,做任务停滞不前;另一方面,学长们大量且重复的讲解,也是对学长本身时间的大量浪费。结合自己自学的经历和征集来的意见,特地写下《实验室新生成长指南》,由浅入深的带领新生慢慢形成对

考研系列-数据结构第一章、绪论(基本术语、时间复杂度)

目录 一、数据结构的基本概念 1.基本概念和术语 2.习题易错题-选择题 3.习题易错题-简答题 二、算法和算法评价指标 1.算法基本概念 2.时间复杂度计算 3.空间复杂度 4.易错题总结 三、章节归纳总结 四、参考 一、数据结构的基本概念 1.基本概念和术语 数据: 数据是信息的载体 , 是描述客观事物属性的数 、 字符及所有能输入到计算机中并被计算