场景文本检测识别学习 day10（MMdetection）

2024-05-29 00:12

文章标签 学习检测 day10 场景文本识别 mmdetection

本文主要是介绍场景文本检测识别学习 day10（MMdetection），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

配置文件(config)

由于在大型项目中，一种模型需要分：tiny、small、big等很多种，而它们的区别主要在网络结构，数据的加载，训练策略等，且差别很多都很小，所以如果每个模型都手动从头写一份，很麻烦，为了方便，现在都是直接采用配置文件的形式来定义
如yaml文件、py文件等

MMdetection的配置文件构成

在MMdection的配置文件中，我们根据字段来定义模型训练的各部分
配置文件的运作方式

使用MMdection来训练自己的检测模型

在这里插入图片描述

coco数据集的组织形式
coco数据集的标注格式
所有标注信息存储在一个JSON对象中，包含以下信息：images–所有原始图像信息、annotations–所有标注信息、categories–全部物体类别信息
其中：name表示当前的物体类别，supercategories表示当前物体的超类，如car的超类为vehicle
我们将自己的数据集按照以上的格式整理好后，还需要更改模型的配置文件（有些模型是继承coco_instance.py，需要仔细查找），如下：
重点是需要修改：数据集的路径、batch_size、进程数
在将原始图像输入进模型之前，我们可能还需要对图像进行：随机裁剪与缩放、水平翻转、像素值归一化、转换为PyTorch Tensor等操作，这些操作我们统一放在数据处理流水线，即pipeline中。对于微调训练，通常情况是不需要进行更改的
下图为分类的pipeline：
由于检测有框，所以多了一个annotations，对于框也需要进行跟原始图片一样的操作，下图是检测的：

这篇关于场景文本检测识别学习 day10（MMdetection）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1012089。 23002807@qq.com

相关文章

Java学习手册之Filter和Listener使用方法

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》：本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter（过滤器）1. Filter 的工作原理2. Filter 的配置与使用二、Listen

阅读更多...

Java字符串操作技巧之语法、示例与应用场景分析

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

阅读更多...

C#TextBox设置提示文本方式(SetHintText)

C#TextBox设置提示文本方式(SetHintText)

《C#TextBox设置提示文本方式(SetHintText)》：本文主要介绍C#TextBox设置提示文本方式(SetHintText),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录C#TextBox设置提示文本效果展示核心代码总结C#TextBox设置提示文本效果展示核心代

阅读更多...

SpringBoot应用中出现的Full GC问题的场景与解决

SpringBoot应用中出现的Full GC问题的场景与解决

《SpringBoot应用中出现的FullGC问题的场景与解决》这篇文章主要为大家详细介绍了SpringBoot应用中出现的FullGC问题的场景与解决方法,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录Full GC的原理与触发条件原理触发条件对Spring Boot应用的影响示例代码优化建议结论F

阅读更多...

SpringBoot条件注解核心作用与使用场景详解

SpringBoot条件注解核心作用与使用场景详解

《SpringBoot条件注解核心作用与使用场景详解》SpringBoot的条件注解为开发者提供了强大的动态配置能力,理解其原理和适用场景是构建灵活、可扩展应用的关键,本文将系统梳理所有常用的条件注... 目录引言一、条件注解的核心机制二、SpringBoot内置条件注解详解1、@ConditionalOn

阅读更多...

Python 迭代器和生成器概念及场景分析

Python 迭代器和生成器概念及场景分析

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这... 目录迭代器的介绍自定义迭代器省略的迭代器生产器的介绍yield的普通用法yield的高级用法yidle

阅读更多...

C++ Sort函数使用场景分析

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

阅读更多...

kotlin中const 和val的区别及使用场景分析

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二代码示例1 Java

阅读更多...

使用Python实现文本转语音(TTS)并播放音频

使用Python实现文本转语音(TTS)并播放音频

《使用Python实现文本转语音(TTS)并播放音频》在开发涉及语音交互或需要语音提示的应用时,文本转语音（TTS）技术是一个非常实用的工具,下面我们来看看如何使用gTTS和playsound库将文本... 目录什么是 gTTS 和 playsound安装依赖库实现步骤 1. 导入库2. 定义文本和语言 3

阅读更多...

Java中&和&&以及|和||的区别、应用场景和代码示例

Java中&和&&以及|和||的区别、应用场景和代码示例

《Java中&和&&以及|和||的区别、应用场景和代码示例》：本文主要介绍Java中的逻辑运算符&、&&、|和||的区别,包括它们在布尔和整数类型上的应用,文中通过代码介绍的非常详细,需要的朋友可... 目录前言1. & 和 &&代码示例2. | 和 ||代码示例3. 为什么要使用 & 和 | 而不是总是使

阅读更多...