cs231n-Lecture1

2023-11-07 15:30
文章标签 cs231n lecture1

本文主要是介绍cs231n-Lecture1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CV–深度学习–神经网络–卷积神经网络


- 计算机视觉是人工智能中发展最迅速的内容。
- 2016年思科估计80%的网络数据是像素数据,进入到一个信息爆炸的时代,原因:1、互联网载体;2、传感器–手机、摄像头
- 互联网暗物质–数据冗余,像素信息很难理解,就像银河系内的暗物质。
- YouTube服务器接受150h video/60s。人眼很难给这些数据做标记、分类、索引,操作这些数据需要自动化。

CV–跨学科领域

这里写图片描述
- 涉及:工程、物理、生物、心理学、计算机科学以及数学
- CV–深度学习–神经网络

斯坦福cs231n类似的课程

  • cs131 – 本科介绍课程
  • cs231a – 核心CV课程、课题包括图像处理、成像、3D重建、视频分段、目标识别以及场景理解
  • cs231n – 神经网络(深度学习)在图像识别中的应用

CV的简短历史

1、寒武纪大爆发(BIG BANG)-公元前5.43亿年

  • 浮游生物漂浮在水中,等着食物进入嘴中,突然有一天生物爆发
  • 澳大利亚研究起源是生物进化出了眼睛,捕捉光线,进行环境信息交换,获取食物。
  • 视觉的出现是大爆发的最主要驱动力

2、文艺复兴时期

  • 现代意义上的相机的出现-达芬奇,现代视觉工程的开端,记录世界,但是没有信息的理解,仅仅是复制。
  • 电影、商用相机(柯达)、摄像机。

3、动物视觉原理&架构–Hubel&Wiesel

  • 将电极放入猫的大脑中,基础视觉皮质(primary visual cortex)– 处理视觉
  • 神经元处理视觉信息,实际上后脑处理视觉部分远离眼睛,50%的大脑参与视觉处理
  • 视觉占据更多资源,因为视觉处理太难了,视觉信息含量大。
  • 猫的实验中,目标是鱼-神经元脉冲,实际上鱼、花、草都不会产生神经元脉冲。更换幻灯片产生边缘切换会激发神经元信号
  • 基础视觉区的神经元是按照列组成,每一列响应不同的线条。

4、Block world

  • by Lary Roberts in 1963,计算机视觉博士论文,后来从事互联网
  • 大脑对信息的处理是基于边缘和形状,边缘决定结构

5、1966年

  • 人工智能实验室:1、MIT;2、Stanford John McCarthy建立,比计算机科学还要早
  • AI一次由John McCarthy提出,计算机视觉由MIT开始研究
  • 暑期工程目标,未完成。

6、《Vision》–David Marr,1970

这里写图片描述

  • 视觉是分层的,图像时多层的:输入层、边缘层、2.5D层、3D(最后重建)
  • 视觉是复杂的,像素的排列组合无穷无尽。

7、视觉算法研究

  • Generalized Cylinder,1979年:整个世界的形状是有圆柱体组成
  • Pictorial Structure,1973:物体有简单部分形状组成,各个部位有“弹簧”组成,允许变形
  • 线条边缘,David Lowe,1987:线条边缘,圆形和方形
  • Normalized Cut,Shi & Malik,1997:第一次使用现实图片,通过感知分组对彩色图片进行分类
  • Face Detection, Vio & Jones, 2001:黑白条形过滤寻找人脸,第一个人工智能人脸检测算法
  • “SIFT” & Object Recognition, David Lowe,1999: 特征映射,目标识别
  • Spatial Pyramid Matching, Lazebnik, Schmid & Ponce, 2006:金字塔特征提取
  • Histogram of Gradients(HOG),Dalal & Triggs, 2005: 梯度直方图
  • Deformable Part Model,Felzenswalb, McAllester, Ramanan, 2009:可变形部件模型

8、PASCAL 视觉目标检测挑战

  • 20种目标检测,2006-2012

9、Imagenet-2010

  • 22k种类和14Millon图片,集合的dataset
  • IMAGENET,大尺寸视觉识别挑战赛(计算机视觉顶级挑战赛):1000种类,1431167图片
    这里写图片描述

  • 2012年AlexNet-CNN卷积神经网络使得错误率大幅下降,后续都是神经网络模型,2015年已经低于人类的识别率5.1%

cs231n综述

1、cs231n聚焦解决图像分类问题–视觉识别中最重要的问题之一

  • 互联网公司、初创公司、手机拍照、食物识别、电商分类

2、图像分类:目标检测、图像描述、运动识别

3、目标检测的压倒性工具——CNN(Convolutional Neural Network)

这里写图片描述

  • 2012年迎来的计算机视觉新起点–CNN的使用,DeepLearning威力得意体现
  • 1998年杨乐昆提出首个卷积神经网络结构:卷积滤波-池化-卷积滤波-池化的结构
  • 2012年AlexNet几乎相同的结构的成功得益于:算力的提升&训练数据的增长

4、视觉智能不仅仅是目标识别

  • 感知分组、识别&3D、场景重建

这里写图片描述

  • 图片理解:动作识别、目标关系、语义识别——Visual Genome
  • 愿景:生物视觉系统的强大,看图说话,人500ms后形成一个故事。使我们的生活更好。
  • 相关作业链接:http://cs231n.github.io/assignments2018/assignment1/

这篇关于cs231n-Lecture1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/364577

相关文章

【Lecture1】清华大学大模型公开课——大模型绪论

#清华大模型公开课第二季 #OpenBMB 目录 1. The Evolution of Artificial Intelligence --History 人工智能的演变--历史 1.1 Definition of AI --定义 1.2 Conceptualization of AI -- 概念 1.3 Birth of AI as a Discipline 1.4 Develop

斯坦福深度学习课程CS231N 2017

官网:http://cs231n.stanford.edu/index.html 教学视频:https://study.163.com/course/courseMain.htm?courseId=1003223001&_trace_c_p_k2_=ce601d978e4d408a909911855ef1eb24#/courseDetail https://www.bilibili.co

Stanford CS231N

文章目录 1 introduction to convolutional neural network2 Image classification pipeline2.1 nearest neighbors classifier/KNN2.2 Linear classification 3 loss function and optimization3.1 loss function of

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(四):图像分类笔记(上)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(四):图像分类笔记(上) 图像分类 目标:这一节我们将介绍图像分类问题。所谓图像分类问题,就是已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个分类标签,最

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(三):Python Numpy教程(3)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(三):Python Numpy教程 SciPy Numpy提供了高性能的多维数组,以及计算和操作数组的基本工具。SciPy基于Numpy,提供了大量的计算和操作数组的函数,这

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(二):Python Numpy教程(2)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(二):Python Numpy教程 Numpy Numpy是Python中用于科学计算的核心库。它提供了高性能的多维数组对象,以及相关工具。 数组Arrays 一个num

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(一):Python Numpy教程(1)

最近开了一个新坑——【CS231n】斯坦福大学李飞飞视觉识别课程,准备认真学习并记录自己的学习历程。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(一):Python Numpy教程 这个课程将使用Python编程语言来

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(十八):卷积神经网络笔记(上)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(十八):卷积神经网络笔记(上) 卷积神经网络(CNNs / ConvNets) 卷积神经网络和上一章讲的常规神经网络非常相似:它们都是由神经元组成,神经元中有具有学习能力的权

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(十七):神经网络笔记3(下)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(十七):神经网络笔记3(下) 参数更新 一旦能使用反向传播计算解析梯度,梯度就能被用来进行参数更新了。进行参数更新有好几种方法,接下来都会进行讨论。 深度网络的最优化是现在

【CS231n】斯坦福大学李飞飞视觉识别课程笔记(十六):神经网络笔记3(上)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记 由官方授权的CS231n课程笔记翻译知乎专栏——智能单元,比较详细地翻译了课程笔记,我这里就是参考和总结。 【CS231n】斯坦福大学李飞飞视觉识别课程笔记(十六):神经网络笔记3(上) 学习过程 在前面章节中,我们讨论了神经网络的静态部分:如何创建网络的连接、数据和损失函数。本节将致力于讲解神经网络的动态部分,即神经网络学习参数