斯坦福CS231n assignment1:SVM图像分类原理及实现

2023-10-15 03:58

本文主要是介绍斯坦福CS231n assignment1:SVM图像分类原理及实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

斯坦福CS231n assignment1:SVM图像分类原理及实现

  • SVM模型原理
  • SVM的一种直观解释
  • 损失函数
  • 损失函数加入正则化项
  • 梯度下降和梯度检验
  • 图像预处理
  • 小批量数据梯度下降(Mini-batch gradient descent)
  • 代码实现

分类
本文Github代码

斯坦福CS231n课程讲解了实现图像分类的方法,从传统的KNN,SVM,到CNN,LSTM模型,讲解的非常专业精准。同时该课程提供了相应的习题来检验和巩固讲授的知识,如果能按部就班的完成,对神经网络将会有深刻的体会和理解。本文将结合代码实现讲解其中的SVM方法实现图像分类的原理和方法,以及需要注意的知识细节。

SVM模型原理

SVM通过平面将空间中的实例划分到不同的类别,从而实现分类。这里的空间包括二维空间,三维空间,一直到高维空间,具体的维数等于实例的特征数量,如果我们待分类的图片是32*32*3(长宽分别是32个像素,RGB3个颜色通道)维的,那么图片所处的空间就是3072维的空间。在这个高维空间,我们通过由权重向量W和偏置项b确定的一个(实际上是一组)超平面来将图片进行分类。为了可视化,我们将多维空间压缩到二维空间,那么就是下面的图像:
通过超平面进行分类

这里每一个平面都将整个高维空间划分成两部分,平面的一侧是某一类图片,另一侧是这个类别之外的其他图片。比如红色的平面一侧是汽车这个类别,另一侧是非汽车类别。每一个类别都对应一个平面,这些平面互相之间不存在关联,利用SVM模型进行分类的目的就是确定这样一组平面,使得同一类尽可能划分在该类对应的平面的一侧,其他类尽可能在另一侧,而且两种类别离平面的距离越大越好(平面尽可能把两类分的更开),这是SVM模型的思路。

所有这些类别对应的平面通过下面的矩阵唯一确定:
线性映射矩阵

其中改变W可以使平面旋转,而改变b使平面平移。如果b为0,此时W*0=0,那么平面会经过原点。

SVM的一种直观解释

SVM模型用于图像分类可以看做给每一种图像的类别生成一个图像模板,然后拿待分类的图像和这个图像模板做内积,计算他们的相似度,相似度最高的类别就是分类类别。根据这个思想,生成的权重向量可视化如下:

图像模板

可以看出,这些图像模板比较能够代表某种类别的共性,比如car类别是一辆红色的车的形象,而horse类型是左右两匹马的形象,这些是集合了所有训练样本得出的模板。从这个角度,SVM可以看做KNN模型的一种简化,KNN模型对一张图片分类时需要和所有训练样本做比较,而SVM只需要和抽象出来的每个类别下的一个图像模板做比较即可,显然更高效。

损失函数

SVM模型有多种不同的实现,区别主要体现在损失函数的定义上,可以根据实现分为:

  1. 经典SVM
  2. Structured SVM

其中经典SVM模型核心思路是找一个超平面将不同类别分开,同时使得离超平面最近的点的距离最大,这样能保证即使是最难区分的点,也有较大的确信度将它

这篇关于斯坦福CS231n assignment1:SVM图像分类原理及实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/215187

相关文章

Java线程池核心参数原理及使用指南

《Java线程池核心参数原理及使用指南》本文详细介绍了Java线程池的基本概念、核心类、核心参数、工作原理、常见类型以及最佳实践,通过理解每个参数的含义和工作原理,可以更好地配置线程池,提高系统性能,... 目录一、线程池概述1.1 什么是线程池1.2 线程池的优势二、线程池核心类三、ThreadPoolE

使用Redis实现会话管理的示例代码

《使用Redis实现会话管理的示例代码》文章介绍了如何使用Redis实现会话管理,包括会话的创建、读取、更新和删除操作,通过设置会话超时时间并重置,可以确保会话在用户持续活动期间不会过期,此外,展示了... 目录1. 会话管理的基本概念2. 使用Redis实现会话管理2.1 引入依赖2.2 会话管理基本操作

mybatis-plus分表实现案例(附示例代码)

《mybatis-plus分表实现案例(附示例代码)》MyBatis-Plus是一个MyBatis的增强工具,在MyBatis的基础上只做增强不做改变,为简化开发、提高效率而生,:本文主要介绍my... 目录文档说明数据库水平分表思路1. 为什么要水平分表2. 核心设计要点3.基于数据库水平分表注意事项示例

C#高效实现在Word文档中自动化创建图表的可视化方案

《C#高效实现在Word文档中自动化创建图表的可视化方案》本文将深入探讨如何利用C#,结合一款功能强大的第三方库,实现在Word文档中自动化创建图表,为你的数据呈现和报告生成提供一套实用且高效的解决方... 目录Word文档图表自动化:为什么选择C#?从零开始:C#实现Word文档图表的基本步骤深度优化:C

nginx跨域访问配置的几种方法实现

《nginx跨域访问配置的几种方法实现》本文详细介绍了Nginx跨域配置方法,包括基本配置、只允许指定域名、携带Cookie的跨域、动态设置允许的Origin、支持不同路径的跨域控制、静态资源跨域以及... 目录一、基本跨域配置二、只允许指定域名跨域三、完整示例四、配置后重载 nginx五、注意事项六、支持

Qt实现对Word网页的读取功能

《Qt实现对Word网页的读取功能》文章介绍了几种在Qt中实现Word文档(.docx/.doc)读写功能的方法,包括基于QAxObject的COM接口调用、DOCX模板替换及跨平台解决方案,重点讨论... 目录1. 核心实现方式2. 基于QAxObject的COM接口调用(Windows专用)2.1 环境

MySQL查看表的历史SQL的几种实现方法

《MySQL查看表的历史SQL的几种实现方法》:本文主要介绍多种查看MySQL表历史SQL的方法,包括通用查询日志、慢查询日志、performance_schema、binlog、第三方工具等,并... 目录mysql 查看某张表的历史SQL1.查看MySQL通用查询日志(需提前开启)2.查看慢查询日志3.

Java实现字符串大小写转换的常用方法

《Java实现字符串大小写转换的常用方法》在Java中,字符串大小写转换是文本处理的核心操作之一,Java提供了多种灵活的方式来实现大小写转换,适用于不同场景和需求,本文将全面解析大小写转换的各种方法... 目录前言核心转换方法1.String类的基础方法2. 考虑区域设置的转换3. 字符级别的转换高级转换

使用Python实现局域网远程监控电脑屏幕的方法

《使用Python实现局域网远程监控电脑屏幕的方法》文章介绍了两种使用Python在局域网内实现远程监控电脑屏幕的方法,方法一使用mss和socket,方法二使用PyAutoGUI和Flask,每种方... 目录方法一:使用mss和socket实现屏幕共享服务端(被监控端)客户端(监控端)方法二:使用PyA

MyBatis-Plus逻辑删除实现过程

《MyBatis-Plus逻辑删除实现过程》本文介绍了MyBatis-Plus如何实现逻辑删除功能,包括自动填充字段、配置与实现步骤、常见应用场景,并展示了如何使用remove方法进行逻辑删除,逻辑删... 目录1. 逻辑删除的必要性编程1.1 逻辑删除的定义1.2 逻辑删php除的优点1.3 适用场景2.