cs231n-Lecture1

2023-11-07 15:30

文章标签 cs231n lecture1

本文主要是介绍cs231n-Lecture1，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

CV–深度学习–神经网络–卷积神经网络

- 计算机视觉是人工智能中发展最迅速的内容。
- 2016年思科估计80%的网络数据是像素数据，进入到一个信息爆炸的时代，原因：1、互联网载体；2、传感器–手机、摄像头
- 互联网暗物质–数据冗余，像素信息很难理解，就像银河系内的暗物质。
- YouTube服务器接受150h video/60s。人眼很难给这些数据做标记、分类、索引，操作这些数据需要自动化。

CV–跨学科领域

这里写图片描述
- 涉及：工程、物理、生物、心理学、计算机科学以及数学
- CV–深度学习–神经网络

斯坦福cs231n类似的课程

cs131 – 本科介绍课程
cs231a – 核心CV课程、课题包括图像处理、成像、3D重建、视频分段、目标识别以及场景理解
cs231n – 神经网络（深度学习）在图像识别中的应用

CV的简短历史

1、寒武纪大爆发（BIG BANG）-公元前5.43亿年

浮游生物漂浮在水中，等着食物进入嘴中，突然有一天生物爆发
澳大利亚研究起源是生物进化出了眼睛，捕捉光线，进行环境信息交换，获取食物。
视觉的出现是大爆发的最主要驱动力

2、文艺复兴时期

现代意义上的相机的出现-达芬奇，现代视觉工程的开端，记录世界，但是没有信息的理解，仅仅是复制。
电影、商用相机（柯达）、摄像机。

3、动物视觉原理&架构–Hubel&Wiesel

将电极放入猫的大脑中，基础视觉皮质（primary visual cortex）– 处理视觉
神经元处理视觉信息，实际上后脑处理视觉部分远离眼睛，50%的大脑参与视觉处理
视觉占据更多资源，因为视觉处理太难了，视觉信息含量大。
猫的实验中，目标是鱼-神经元脉冲，实际上鱼、花、草都不会产生神经元脉冲。更换幻灯片产生边缘切换会激发神经元信号
基础视觉区的神经元是按照列组成，每一列响应不同的线条。

4、Block world

by Lary Roberts in 1963，计算机视觉博士论文，后来从事互联网
大脑对信息的处理是基于边缘和形状，边缘决定结构

5、1966年

人工智能实验室：1、MIT；2、Stanford John McCarthy建立，比计算机科学还要早
AI一次由John McCarthy提出，计算机视觉由MIT开始研究
暑期工程目标，未完成。

6、《Vision》–David Marr，1970

这里写图片描述

视觉是分层的，图像时多层的：输入层、边缘层、2.5D层、3D（最后重建）
视觉是复杂的，像素的排列组合无穷无尽。

7、视觉算法研究

Generalized Cylinder，1979年：整个世界的形状是有圆柱体组成
Pictorial Structure，1973：物体有简单部分形状组成，各个部位有“弹簧”组成，允许变形
线条边缘，David Lowe，1987：线条边缘，圆形和方形
Normalized Cut，Shi & Malik，1997：第一次使用现实图片，通过感知分组对彩色图片进行分类
Face Detection， Vio & Jones， 2001：黑白条形过滤寻找人脸，第一个人工智能人脸检测算法
“SIFT” & Object Recognition, David Lowe,1999: 特征映射，目标识别
Spatial Pyramid Matching, Lazebnik, Schmid & Ponce, 2006：金字塔特征提取
Histogram of Gradients(HOG),Dalal & Triggs, 2005: 梯度直方图
Deformable Part Model，Felzenswalb, McAllester, Ramanan, 2009：可变形部件模型

8、PASCAL 视觉目标检测挑战

20种目标检测，2006-2012

9、Imagenet-2010

22k种类和14Millon图片，集合的dataset
IMAGENET,大尺寸视觉识别挑战赛（计算机视觉顶级挑战赛）：1000种类，1431167图片
2012年AlexNet-CNN卷积神经网络使得错误率大幅下降，后续都是神经网络模型，2015年已经低于人类的识别率5.1%

cs231n综述

1、cs231n聚焦解决图像分类问题–视觉识别中最重要的问题之一

互联网公司、初创公司、手机拍照、食物识别、电商分类

2、图像分类：目标检测、图像描述、运动识别

3、目标检测的压倒性工具——CNN（Convolutional Neural Network）

这里写图片描述

2012年迎来的计算机视觉新起点–CNN的使用，DeepLearning威力得意体现
1998年杨乐昆提出首个卷积神经网络结构：卷积滤波-池化-卷积滤波-池化的结构
2012年AlexNet几乎相同的结构的成功得益于：算力的提升&训练数据的增长

4、视觉智能不仅仅是目标识别

感知分组、识别&3D、场景重建

这里写图片描述

图片理解：动作识别、目标关系、语义识别——Visual Genome
愿景：生物视觉系统的强大，看图说话，人500ms后形成一个故事。使我们的生活更好。
相关作业链接：http://cs231n.github.io/assignments2018/assignment1/

这篇关于cs231n-Lecture1的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/364577。 23002807@qq.com

相关文章

【Lecture1】清华大学大模型公开课——大模型绪论

【Lecture1】清华大学大模型公开课——大模型绪论

#清华大模型公开课第二季 #OpenBMB 目录 1. The Evolution of Artificial Intelligence --History 人工智能的演变--历史 1.1 Definition of AI --定义 1.2 Conceptualization of AI -- 概念 1.3 Birth of AI as a Discipline 1.4 Develop

阅读更多...

斯坦福深度学习课程CS231N 2017

斯坦福深度学习课程CS231N 2017

官网：http://cs231n.stanford.edu/index.html 教学视频：https://study.163.com/course/courseMain.htm?courseId=1003223001&_trace_c_p_k2_=ce601d978e4d408a909911855ef1eb24#/courseDetail https://www.bilibili.co

阅读更多...

Stanford CS231N

Stanford CS231N

文章目录 1 introduction to convolutional neural network2 Image classification pipeline2.1 nearest neighbors classifier/KNN2.2 Linear classification 3 loss function and optimization3.1 loss function of

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（四）：图像分类笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（四）：图像分类笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（四）：图像分类笔记（上）图像分类目标：这一节我们将介绍图像分类问题。所谓图像分类问题，就是已有固定的分类标签集合，然后对于输入的图像，从分类标签集合中找出一个分类标签，最

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（三）：Python Numpy教程(3)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（三）：Python Numpy教程(3)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（三）：Python Numpy教程 SciPy Numpy提供了高性能的多维数组，以及计算和操作数组的基本工具。SciPy基于Numpy，提供了大量的计算和操作数组的函数，这

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（二）：Python Numpy教程(2)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（二）：Python Numpy教程(2)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（二）：Python Numpy教程 Numpy Numpy是Python中用于科学计算的核心库。它提供了高性能的多维数组对象，以及相关工具。数组Arrays 一个num

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（一）：Python Numpy教程(1)

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（一）：Python Numpy教程(1)

最近开了一个新坑——【CS231n】斯坦福大学李飞飞视觉识别课程，准备认真学习并记录自己的学习历程。【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（一）：Python Numpy教程这个课程将使用Python编程语言来

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十八）：卷积神经网络笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十八）：卷积神经网络笔记（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十八）：卷积神经网络笔记（上）卷积神经网络（CNNs / ConvNets）卷积神经网络和上一章讲的常规神经网络非常相似：它们都是由神经元组成，神经元中有具有学习能力的权

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十七）：神经网络笔记3（下）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十七）：神经网络笔记3（下）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十七）：神经网络笔记3（下）参数更新一旦能使用反向传播计算解析梯度，梯度就能被用来进行参数更新了。进行参数更新有好几种方法，接下来都会进行讨论。深度网络的最优化是现在

阅读更多...

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十六）：神经网络笔记3（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十六）：神经网络笔记3（上）

【CS231n】斯坦福大学李飞飞视觉识别课程笔记由官方授权的CS231n课程笔记翻译知乎专栏——智能单元，比较详细地翻译了课程笔记，我这里就是参考和总结。【CS231n】斯坦福大学李飞飞视觉识别课程笔记（十六）：神经网络笔记3（上）学习过程在前面章节中，我们讨论了神经网络的静态部分：如何创建网络的连接、数据和损失函数。本节将致力于讲解神经网络的动态部分，即神经网络学习参数

阅读更多...