西瓜专题

【西瓜书】第一二章笔记

耽于学业,选择速记,后续再补。本笔记质量不高,敬请谅解。 关键词: 监督学习(Supervised Learning):一种机器学习范式,其中模型在带有标签的数据集上进行训练。标签提供了正确的答案,算法通过对比预测结果与实际标签,调整模型参数以最小化误差。监督学习主要包括分类和回归两种任务。 模型(Model):在机器学习中,模型是用来表示输入数据与输出结果之间关系的数学结构。模型可

东明第19届西瓜节背后的秘密

中共东明县委书记孙迁国致辞 6月16日,随着华灯初上,东明县小井镇沉浸在一片欢乐祥和的氛围中。备受瞩目的第十九届西瓜节在这里盛大开幕,数万观众汇聚一堂,共同见证了东明县以西瓜为纽带,连接传统与现代、文化与经济的甜蜜盛事。 开幕式现场气氛热烈而喜庆。活动邀请了众多知名歌手演员,其中梦然、甘苹和周晓鸥等艺人的精彩表演赢得了观众的阵阵掌声和喝彩声。相声、舞蹈、戏曲等多

类别朴素贝叶斯CategoricalNB和西瓜数据集

CategoricalNB 1 CategoricalNB原理以及用法2 数据集2.1 西瓜数据集2.2 LabelEncoder2.3 OrdinalEncoder 3 代码实现 1 CategoricalNB原理以及用法 (1)具体原理 具体原理可看:贝叶斯分类器原理 sklearn之CategoricalNB对条件概率的原理如下: P ( x i = k ∣ y ) =

【西瓜书】9.聚类

聚类任务是无监督学习的一种用于分类等其他任务的前驱过程,作为数据清洗,基于聚类结果训练分类模型 1.聚类性能度量(有效性指标) 分类任务的性能度量有错误率、精度、准确率P、召回率R、F1度量(P-R的调和平均)、TPR、FPR、AUC回归任务的性能度量有均方误差MSE、根均方误差RMSE、平均绝对误差MAE、R-Squared聚类任务的性能度量分为三个外部指标+两个内部指标 外部指标:和一个参

【西瓜书】6.支持向量机

目录: 1.分类问题SVM         1.1.线性可分         1.2.非线性可分——核函数 2.回归问题SVR 3.软间隔——松弛变量         3.1.分类问题:0/1损失函数、hinge损失、指数损失、对率损失         3.2.回归问题:不敏感损失函数、平方 4.正则化

西瓜书总结——决策树原理+ID3决策树的模拟实现

西瓜书总结——决策树原理+ID3决策树的模拟实现 前言1. 决策树结构2. 决策树的生成(注意区分属性和类别)3. 划分选择3.1 信息熵和信息增益3.2 增益率3.3 基尼指数(鸡你指数) 4. 剪枝处理4.1 预剪枝4.2 后剪枝 5. 连续值与缺失值处理5.1 连续值处理5.2 缺失值处理 6. 模拟实现ID3决策树7. ID3决策树完整代码8. 添加缺失值处理功能的ID3决策树

【西瓜书】2.模型评估与选择

1.经验误差与过拟合 (1)错误率、精度 (2)误差:训练误差/经验误差、泛化误差 (3)过拟合、欠拟合         欠拟合好克服,过拟合无法彻底避免 2.三大任务——评估方法         泛化误差的评估方法,即将测试误差作为泛化误差的近似         注意:测试样本不要出现在训练集中 对于一个数据集,划分为训练集和测试集,方法如下: (1)留出法: 分层采样(保留

【西瓜书】1.绪论

1.基本术语 (1)数据集不带最后一列:样本/示例/特征向量         带最后一列:样例 (2)表头不带最后一列:属性/特征,属性空间/特征空间/样本空间/输入空间          表头最后一列:标记/输出,标记空间/输出空间 (3)训练集:训练示例、训练样本、训练例          测试集:测试示例、测试样本、测试例 (4)学习任务:分类(二分类/多分类)、回归、聚类

【西瓜书】5.神经网络

1.概念 有监督学习正向传播:输入样本---输入层---各隐层---输出层反向传播:误差以某种形式在通过隐层向输入层逐层反转,并将误差分摊给各层的所有单元,以用于修正各层的权值激活函数:也叫阶跃函数,目的是引入非线性因素,有很多种激活函数,如sigmoid,relu,使用情景如下 激活函数作用:如果没有激活函数,则不管有几个隐藏层,都只能表示线性切割,即与单层神经网络相同,而通过使用激活函

西瓜播放器xgplayer设置自动播放踩坑

上图是官网(西瓜视频播放器官方中文文档)的介绍,相信大家都是按照官网配置去做的,但是并没有什么用,插件很好用,但是属性不全,真的很悔恨,找遍 api 都没有找到自动播放的属性!!最终看了大佬的文章发现了autoplayMuted属性             'autoplayMuted':true, 允许自动播放 设置了这一属性,立马生效,都不需要什么 autoplay

机器学习-利用信息熵来学习如果分辨好西瓜

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。 我们通常用Entropy(信息熵来度量划分的凌乱程度)。 Ent(D)越小,则信息熵的复杂程度越低,D的纯度(一

Qt 之图形(简笔画-绘制漂亮的西瓜)

作者: 一去、二三里 个人微信号: iwaleon 微信公众号: 高效程序员 Summer is coming…我们呢,为大家准备了丰盛的佳果-西瓜,清爽解渴,甘味多汁。 一笔一划学简笔画,分分钟让你掌握一门新技能,下面我们来绘制一个“盛夏之王”-西瓜,赶快一起来试试吧。 简笔画 我们先简单看看西瓜的基本组成,一步步进行拆分、组合。 绘制 效果 具体的效果如下所示,我们可以

【西瓜书机器学习】第五章 神经网络

一起啃西瓜书(5)-神经网络《机器学习-周志华》 - 知乎 (zhihu.com)参考进行自我复习整理,侵删! 1、神经元模型 神经网络定义:神经网络是由 具有适应性 的 简单单元 组成的广泛 并行互连 的网络。M-P神经元模型:输入、处理、输出         第二步超过阈值则兴奋(做出反应),否则不兴奋(没反应) ,通过f(x)阶跃函数实现,但阶跃函数不连续,使用sigmo

西瓜书学习——决策树形状、熵和决策树的本质

文章目录 决策树形状监督学习算法分类与回归 熵信息熵香农熵 (Shannon Entropy) - H(X)联合熵 (Joint Entropy) - H(X, Y)条件熵 (Conditional Entropy) - H(Y|X)互信息 (Mutual Information) - I(X; Y)相对熵 (Relative Entropy) / KL散度 (Kullback-Leible

西瓜书学习——线性判别分析

文章目录 定义LDA的具体步骤1. 计算类内散布矩阵(Within-Class Scatter Matrix)2. 计算类间散布矩阵(Between-Class Scatter Matrix)3. 求解最佳投影向量4. 数据投影5. 分类 定义 线性判别分析(Linear Discriminant Analysis,简称LDA)是一种常用的监督学习降维技术,主要应用于模式识别和

西瓜书学习——对数几率回归

对数几率回归(Logistic Regression)是一种广泛应用于分类问题的统计方法,特别是用于二分类问题。尽管它的名字中包含“回归”,但它实际上是一种分类算法,用于估计一个样本属于某个类别的概率。 对数几率回归的核心是使用逻辑函数(Logistic Function),也称为 sigmoid 函数,将线性回归的输出映射到 0 和 1 之间的概率。sigmoid 函数定义为: S ( x

隐马尔可夫模型(HMM)硬啃西瓜书

隐马尔可夫模型(HMM) 好吧隐马尔可夫模型出现的次数实在有点多;今天来讲讲吧 先来四个概念: 可见状态链 观测结果隐含状态链 产生结果的实体类型转换概率 相邻实体之间转换的概率输出概率 实体输出结果的概率 两个基本假设: 1) 齐次马尔科夫链假设。即任意时刻的隐藏状态只依赖于它前一个隐藏状态。 2) 观测独立性假设;实体输出结果的概率完全独立 本来说的是参考几篇文章来写,t

西瓜视频怎么保存到相册

怎么将西瓜视频喜欢看的视频下载到手机相册,没网的时候也能看。现在看西瓜视频的人越来越,里面喜欢的视频也数不胜数,那么怎么将西瓜视频里面的视频保存到相册呢。分享三种有效的方法。 1、第三方软件 利用第三方的一些保存工具来保存,像下载狗解析工具(xiazaitool.com)一类的,把视频链接复制到工具里面获取保存即可。这类软件除了保存视频以外,还可以直接把水印去除,可谓是一举两得。 2、直接录

西瓜书学习——第一、二章笔记

@[] 什么是机器学习? 研究关于“学习算法”(一类能从数据中学习出其背后潜在规律的算法)的一门学科。 PS:深度学习指的是神经网络那一类学习算法,因此是机器学习的子集。 假设空间和版本空间 举个栗子:假设现已收集到某地区近几年的房价和学校数量数据,希望利用收集到的数据训练出能通过学校数量预测房价的模型,具体收集到的数据如下表所示: **假设空间:**一元一次函数,算法: 线性回归

自动上传视频到B站和西瓜视频

代码效果演示 Gitee源码 # -*- coding: utf-8 -*-# Version: Python 3.9.7# Author: TRIX# Date: 2021-09-14 21:34:14# Use:自动生成视频封面 并自动上传视频到B站 和 西瓜视频 由于该程序部分代码只适配于作者的硬件和软件 部分快捷键为作者自定义 在对代码修改前 请勿随意运行该程序 视频配置要求文件

西瓜视频怎么去水印下载

西瓜视频怎么去水印下载 在当今数字化时代,视频已经成为我们生活中不可或缺的一部分。观看视频时,我们经常会被一些令人惊叹的瞬间所吸引。幸运的是,现在我们有了简单易用的方法,可以将这些精彩瞬间从视频中提取出来,并转化为永恒精美的照片。本文将与大家分享一些视频提取下载的方法,帮助你轻松获取无水印的视频,从而让你的视频创作之路更加便捷。 西瓜视频怎么去水印下载 第一步 打开西瓜短视频平台,找到您要

机器学习理论 | 周志华西瓜书 第十六章:强化学习

第十六章 强化学习 此系列文章旨在提炼周志华《机器学习》的核心要点,不断完善中… 16.1 任务与奖赏 通常使用马尔可夫决策过程(MDP)描述目的:找到能长期积累奖赏最大化策略长期奖赏方式 T步积累奖赏: E [ 1 T ∑ t = 1 T r t ] \mathbb{E}[\frac 1 T\sum_{t=1}^Tr_t] E[T1​∑t=1T​rt​] γ折扣积累奖赏: E [ ∑

机器学习理论 | 周志华西瓜书 第十五章:规则学习

第十五章 规则学习 此系列文章旨在提炼周志华《机器学习》的核心要点,不断完善中… 15.1 基本概念 规则:语义明确,能描述数据分布所隐含的客观规律或领域概念规则学习:从训练数据中学习一种能用于未见示例进行判别的规则优点:有更好的可解释性、有冲突可进行冲突消解 15.2 序贯覆盖(分治策略) 原因:规则学习的目标是产生一个能覆盖尽可能多的样例的规则集,最直接做法——序贯覆盖(逐条归纳

机器学习理论 | 周志华西瓜书 第十二章:计算学习理论

第十二章 计算学习理论 此系列文章旨在提炼周志华《机器学习》的核心要点,不断完善中… 12.1 基础知识 1、概述 目的:分析学习任务的困难本质,为学习算法提供理论保证) 2、一些定义 令h为从X到Y的映射,h的泛化误差: E ( h ; D ) = P x ∼ D ( h ( x ) ≠ y ) E(h;\mathcal{D})=P_{\bm x\sim\mathcal{D}}(h

机器学习理论 | 周志华西瓜书 第十一章:特征选择与稀疏学习

第十一章 特征选择与稀疏学习 此系列文章旨在提炼周志华《机器学习》的核心要点,不断完善中… 11.1 子集搜索与评价 1、一些概念 特征/相关特征/无关特征 冗余特征:所包含的信息能从其他特征中推演出来(多数时候不起作用,除去以减轻学习负担,但有时会降低学习任务的难度) 2、特征选择的原因:减轻维数灾难,降低学习难度 3、特征选择方法本质 特征子集搜索机制(subset searc

机器学习理论 | 周志华西瓜书 第十章:降维与度量学习

第十章 降维与度量学习 此系列文章旨在提炼周志华《机器学习》的核心要点,不断完善中… 10.1 k近邻学习 1、描述 常用的监督学习方法 工作机制:给定测试集,基于某距离度量找出最靠近的k个样本,基于k个邻居的信息预测 分类——投票法回归——平均法 懒惰学习的代表 2、懒惰学习与急切学习 懒惰学习(lazy study):没有显式训练过程,仅把样本保存,训练时间无开销,待收到测试