CS230 Lecture 2深度学习的直观认识(Deep Learning Intuition)

2024-02-17 12:38

本文主要是介绍CS230 Lecture 2深度学习的直观认识(Deep Learning Intuition),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

观看斯坦福大学公开课CS230后记录笔记,以便以后查阅之用。

在这里插入图片描述
使用逻辑回归解决特定目标是否在图片中问题时,对于判断目标是否存在于图片中,对输出的编码可以采用sigmoid函数编码,设置一个阈值,当模型输出大于阈值时,判断存在,反之不存在图中。

在这里插入图片描述

解决一个动物分类问题时,当图片中只有一个动物时,可以使用One-Hot编码,当图片中存在多个动物时,也可以采One-Hot编码,例如[1,1,0],表示图片中存在小狗和小猫。

Deep Learning解决一些问题

在这里插入图片描述

这里解决一个给定一个image判断image是白天还是黑夜的问题。

  1. 数据。估算一下模型的复杂度,这不是一个非常难的分类问题,按照以往的经验大概需要1万张image训练模型,8:2比例划分为训练数据和验证数据集。训练模型的好坏应该以人类的标准衡量模型的分类偏差,例如如果连我们自己都很难分辨一张图片的白天黑夜,那么模型分类错误也就情有可原了。
  2. 输入。输入模型的数据是像素级别的数据。分辨率应该保证分类准确率召回率的条件下,采用越低越好,这样有利于模型的robust。这个很好理解,因为model的input neurons是规定好的,如果遇到分辨率很高的图片可以下采样同样可以达到很好的accuracy和recall,但是如果给定一个分辨率很低的image,而model的input neurons很多,使用分辨率很低的图片上采样会降低model 的 accuracy和recall。
  3. 输出。白天和黑夜输出,采用1表示白天,0表示黑夜。最后一层的输出采用sigmoid函数。
  4. DNN架构。采用一个shallow的network就可以得到一个很好的结果。相反的如果采用一个比较deep的network会使得loss function有很多的local minimum从而导致训练难度增加,还会使得训练的数据量也得增加。
  5. Loss function。这里是一个分类问题,采用采用cross entropy可能会有比较好的结果。

在这里插入图片描述

在这里插入图片描述

解决一个人脸验证的问题:给定你的现在的照片和你的学生卡,学校通过这套系统查看你学生ID在数据库的照片来确认你是否和数据库中的照片是一个人

  1. 使用传统算法遇到的问题。当使用传统算法计算两张照片之间的像素距离(欧式距离等),由于背景不同、穿着打扮不同的原因容易造成分类错误。
  2. 神经网络架构。使用一套在ImageNet等数据集训练好权重的network,去掉最后几层网络,使用当前学校数据库的照片训练model,输出一个向量例如最后一层的output neuron是128个,输出128维向量。进行比对的时候输入该ID的数据库照片model产生一个vector,输入该学生现在的照片输出一个vector,计算这两个vector之间的Distance即可。

在这里插入图片描述

解决一个人脸识别问题,进学校门时由人脸识别系统识别你是本校的学生

  1. 模型架构。训练模型时首先构造一个三元组(Anchor,Positive, Negtive),Anchor代表门口照相机验证时给你拍摄的照片,Positive是你在数据库中真实的照片,Negtive是其他一个人照片,添加Negtive原因是想让模型学习到同一个人和不同人之间的区别。输入模型三元组,模型输出三个向量Enc(A),Enc§,Enc(N),代表三个照片经过模型处理后的encoding。
  2. Loss function。 L = ∣ ∣ E n c ( A ) − E n c ( P ) ∣ ∣ 2 2 − ∣ ∣ E n

这篇关于CS230 Lecture 2深度学习的直观认识(Deep Learning Intuition)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/717779

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

每天认识几个maven依赖(ActiveMQ+activemq-jaxb+activesoap+activespace+adarwin)

八、ActiveMQ 1、是什么? ActiveMQ 是一个开源的消息中间件(Message Broker),由 Apache 软件基金会开发和维护。它实现了 Java 消息服务(Java Message Service, JMS)规范,并支持多种消息传递协议,包括 AMQP、MQTT 和 OpenWire 等。 2、有什么用? 可靠性:ActiveMQ 提供了消息持久性和事务支持,确保消

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学