Python 全栈体系【四阶】(三十三)

2024-04-23 07:28

本文主要是介绍Python 全栈体系【四阶】(三十三),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第五章 深度学习

六、PaddlePaddle 图像分类

请添加图片描述

1. 概述

1.1 什么是图像分类

图像分类就是将不同的图像划分到不同类别,实现最小分类误差、最高精度。手写体识别就是一个经典的图像分类问题,它将输入图像分为 0~9 某个数字中,实际就是将输入图像分为 10 类。
在这里插入图片描述

1.2 图像分类粒度

(一)跨物种级图像分类:在不同物种层次上识别不同对象,如猫狗分类
请添加图片描述
(二)子类细粒度图像分类:同一大类下,不同子类的分类。如不同的鸟分类,不同的狗分类
请添加图片描述
(三)实例级图像分类:区分不同的个体。如人脸识别
请添加图片描述

1.3 图像分类发展历程

图像分类任务从传统的方法到基于深度学习的方法,经历了几十年的发展
请添加图片描述

1.4 图像分类问题的挑战

虽然图像分类大赛正确率已经接近极限,但在实际工程应用中,面临诸多挑战与难题:

  • 类别不均衡
  • 数据集小
  • 巨大的类内差异
  • 实际应用复杂情况:光照、遮挡、模糊、角度变化、干扰

2. 常用数据集介绍

2.1 MNIST 数据集

手写数字的数据集,来自美国国家标准与技术研究所(National Institute of Standards and Technology,NIST),发布与 1998 年

样本来自 250 个不同人的手写数字,50%高中学生,50%是人口普查局的工作人员

数字从 0 ~ 9,图片大小是 28×28 像素,训练数据集包含 60000 个样本,测试数据集包含 10000 个样本

下载地址:

  • http://yann.lecun.com/exdb/mnist/

在这里插入图片描述

2.2 CIFAR10 数据集

CIFAR10 数据集由 Alex Krizhevsky、Vinod Nair 和 Geoffrey Hinton 等人收集

包含 6 万张彩色图像,图像大小是 32×32,共有 10 个类,每类有 6000 张图。其中,5 万张图组成训练集合,训练集合中的每一类均等,都有 5000 张图;

剩余 1 万张图作为测试集合,测试集合中的每一类也均等,各有 1000 张图

10 个类别是:airplane、automobile、bird、cat、deer、dog、frog、horse、ship 和 truck

下载地址:

  • http://www.cs.toronto.edu/~kriz/cifar.html

在这里插入图片描述

2.3 ImageNet 数据集

ImageNet 数据集由李飞飞实验室发布于 2009 年

1400 多万幅图片,涵盖 2 万多个类别的标注与超过百万的边界框标注,每一个类别大约有 500 ~ 1000 张图片

ImageNet 竞赛使用的是 ImageNet 完整数据集的一个子类,包括 1000 类,其中大部分是动物。在深度学习任务中,我们经常会使用 ImageNet 预训练的模型

下载地址:

  • http://www.image-net.org/

在这里插入图片描述

2.4 FDDB 人脸数据集

发布于 2010 年,是被广泛用于人脸检测方法评测的一个数据集

共 2845 张图像,包含有 5171 张人脸图像,大部是自然条件下拍摄的名人

下载地址:

  • http://vis-www.cs.umass.edu/fddb/index.html#download
    请添加图片描述
2.5 WIDER Face 数据集

2015 年由香港中文大学发布

32203 张图像,共有 393703 张人脸图像,比 FDDB 数据集大 10 倍,而且在面部的尺寸、姿势、遮挡、表情、妆容和光照上都有很大的变化,自发布后广泛应用于评估性能比传统方法更强大的卷积神经网络

下载地址:

  • http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

在这里插入图片描述

3. 图像分类的应用

交通违章识别

在这里插入图片描述
安检系统

在这里插入图片描述
人脸识别

在这里插入图片描述
生物种群数量统计

在这里插入图片描述
工业质检

在这里插入图片描述
工地安全监测

请添加图片描述
病虫害识别

请添加图片描述
医疗诊断

请添加图片描述

这篇关于Python 全栈体系【四阶】(三十三)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/928143

相关文章

python中列表list切分的实现

《python中列表list切分的实现》列表是Python中最常用的数据结构之一,经常需要对列表进行切分操作,本文主要介绍了python中列表list切分的实现,文中通过示例代码介绍的非常详细,对大家... 目录一、列表切片的基本用法1.1 基本切片操作1.2 切片的负索引1.3 切片的省略二、列表切分的高

基于Python实现一个PDF特殊字体提取工具

《基于Python实现一个PDF特殊字体提取工具》在PDF文档处理场景中,我们常常需要针对特定格式的文本内容进行提取分析,本文介绍的PDF特殊字体提取器是一款基于Python开发的桌面应用程序感兴趣的... 目录一、应用背景与功能概述二、技术架构与核心组件2.1 技术选型2.2 系统架构三、核心功能实现解析

通过Python脚本批量复制并规范命名视频文件

《通过Python脚本批量复制并规范命名视频文件》本文介绍了如何通过Python脚本批量复制并规范命名视频文件,实现自动补齐数字编号、保留原始文件、智能识别有效文件等功能,听过代码示例介绍的非常详细,... 目录一、问题场景:杂乱的视频文件名二、完整解决方案三、关键技术解析1. 智能路径处理2. 精准文件名

基于Python开发PDF转Doc格式小程序

《基于Python开发PDF转Doc格式小程序》这篇文章主要为大家详细介绍了如何基于Python开发PDF转Doc格式小程序,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 用python实现PDF转Doc格式小程序以下是一个使用Python实现PDF转DOC格式的GUI程序,采用T

Python使用PIL库将PNG图片转换为ICO图标的示例代码

《Python使用PIL库将PNG图片转换为ICO图标的示例代码》在软件开发和网站设计中,ICO图标是一种常用的图像格式,特别适用于应用程序图标、网页收藏夹图标等场景,本文将介绍如何使用Python的... 目录引言准备工作代码解析实践操作结果展示结语引言在软件开发和网站设计中,ICO图标是一种常用的图像

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

Python中如何控制小数点精度与对齐方式

《Python中如何控制小数点精度与对齐方式》在Python编程中,数据输出格式化是一个常见的需求,尤其是在涉及到小数点精度和对齐方式时,下面小编就来为大家介绍一下如何在Python中实现这些功能吧... 目录一、控制小数点精度1. 使用 round() 函数2. 使用字符串格式化二、控制对齐方式1. 使用

Python如何快速下载依赖

《Python如何快速下载依赖》本文介绍了四种在Python中快速下载依赖的方法,包括使用国内镜像源、开启pip并发下载功能、使用pipreqs批量下载项目依赖以及使用conda管理依赖,通过这些方法... 目录python快速下载依赖1. 使用国内镜像源临时使用镜像源永久配置镜像源2. 使用 pip 的并

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常