首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
task03专题
《动手学深度学习(Pytorch版)》Task03:线性神经网络——4.29打卡
《动手学深度学习(Pytorch版)》Task03:线性神经网络 线性回归基本元素线性模型损失函数随机梯度下降 正态分布与平方损失 线性回归的从零开始实现读取数据集初始化模型参数定义模型定义损失函数定义优化算法训练 线性回归的简洁实现读取数据集定义模型初始化模型参数定义损失函数定义优化算法训练 softmax回归分类问题网络架构softmax运算损失函数熵信息量交叉熵 模型预测和评估 图像分
阅读更多...
DataWhale-西瓜书+南瓜书-第4章决策树学习总结-Task03-202110
4.1 决策树的基本流程 4.2 划分选择 4.2.1 信息增益 “信息熵”是度量样本集合纯度最常用的一种指标。 信息增益定义为: 一般而言,信息增益越大,则意味着使用某属性进行划分所获得的纯度提升越大。 4.2.2 增益率 信息增益偏好
阅读更多...
DataWhale-树模型与集成学习-Task03-集成模式-202110
一、侧边栏练习题 1. 练习1 解答: 由于是白噪声,所以 最后一项推导如下: 根据上面的推导,很容易看出第四个等号成立。 2. 练习2 解答: (1)
阅读更多...
新闻推荐task03-转载
多路召回 所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,所以一般可
阅读更多...
新闻推荐 task03
多路召回 所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,所以一般可
阅读更多...
新闻推荐task03
多路召回 所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,所以一般可
阅读更多...
Task03:偏差与方差理论
文章目录 优化基础模型方差与偏差方差偏差: 特征提取压缩估计(正则化)降维 对模型超参数进行调优(调参) 优化基础模型 方差与偏差 偏差度量的是单个模型的学习能力,而方差度量的是同一个模型在不同数据集上的稳定性。 好的泛化性能,则需使偏差较小,即能够充分拟合数据,并且使方差较小,即使得数据扰动产生的影响小。 方差 测试均方误差呈U形(表明了在测试均方误差中两种力量在博弈)
阅读更多...
集成学习(上)Task03:掌握偏差与方差理论
集成学习(上)Task03:掌握偏差与方差理论 1 偏差-方差的权衡1.1 背景1.2 偏差-方差权衡的理论基础1.3 偏差-方差平衡的具体方法1.3.1 特征提取法1.3.2 压缩估计法1.3.3 降维的方法 引入偏差和方差理论的背景:我们希望建立的机器学习模型在测试数据上表现优异,而不是训练集。 1 偏差-方差的权衡 1.1 背景 当我们的模型的训练均方误差达
阅读更多...
集成学习task03-偏差、方差理论、特征提取和模型超参数调优
一、训练均方误差与测试均方误差 均方误差: M S E = 1 N ∑ i = 1 N ( y i − f ^ ( x i ) ) 2 MSE = \frac{1}{N}\sum\limits_{i=1}^{N}(y_i -\hat{ f}(x_i))^2 MSE=N1i=1∑N(yi−f^(xi))2,其中 f ^ ( x i ) \hat{ f}(x_i) f^(xi)是样本
阅读更多...
Datawhale集成学习学习笔记——Task03偏差和方差理论
偏差和方差理论 偏差和方法理论作业参考 偏差和方法理论 训练均方误差与测试均方误差: 一个模型的训练均方误差最小时, 不能保证测试均方误差同时很小 偏差-方差的权衡 E ( y 0 − f ^ ( x 0 ) ) 2 = Var ( f ^ ( x 0 ) ) + [ Bias ( f ^ ( x 0 ) ) ] 2 + Var ( ε ) E\left(y_{
阅读更多...
Datawhale 零基础入门CV赛事-Task03 利用卷积神经网络建立字符识别模型
在前面的章节,讲解了赛题的背景知识和赛题数据的读取。本章开始构建一个字符识别模型,基于对赛题理解本章将构建一个定长多字符分类模型。 3.1 卷积神经网络-- CNN介绍 卷积神经网络(Convolutional Neural Network, CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,C
阅读更多...