DBnet源码解析

2023-11-23 12:50
文章标签 源码 解析 dbnet

本文主要是介绍DBnet源码解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 1. YAML配置文件
  • 2. 配置文件读取
  • 3. 构造并初始化配置文件中的类
  • 4. DBNet训练过程
    • 4.1 从train.py开始。
    • 4.2 Trainer类实现DBNet训练过程
      • 4.2.1 训练与测试数据组织方式
    • 4.2 DBNet训练过程详解
      • 4.2.1 模型加载
      • 4.2.2 数据集加载
        • 4.2.2.1 训练数据增强
        • 4.2.2.2 生成标签(label generation)
      • 4.2.3 训练
        • 4.2.3.1 训练模型forward
        • 4.2.3.2 训练过程损失计算
    • 4.3 DBNet推理过程详解
  • 总结


前言

之前阅读DBNet论文时,发现很多地方讲的不是很清楚,比如为什么推理阶段速度比以前的方法快 - 没有使用启发式聚类方法根据二值图产生最终的文本框?希望通过阅读源码能够解惑,并且能够训练自己的文本检测数据集。

DBnet 源码github 地址: https://github.com/MhLiao/DB

这里分享下个人的论文阅读笔记:https://blog.csdn.net/DU_YULIN/article/details/118365298


1. YAML配置文件

在这里插入图片描述
DBNet的配置文件包括三个部分:
(1)import: 依赖的其它配置文件,如果没有则为空;
(2)package: 当前配置文件需要加载的python package, 如果没有则为空;
(3)define:当前配置文件中的配置项,如果没有则为空;
define中包括实现DBNet模型相应功能所用的类,类中包括的属性,以及属性的值,允许通过配置的方式来修改DBNet的模型架构,比如更换DBNet的backbone, 修改数据集加载方式,修改数据增强方式等。

DBnet的配置文件分为三类:
(1)“dataset_backbone_deform/large_thre.yaml”:
(1.1)import:依赖的数据集配置文件;
(1.2)define:DBNet模型相关配置项(structure), 训练相关配置项(train),验证相关配置项(validation),日志相关配置项(logger),评估相关配置项(evaluation),这些配置项都在类Experiment有定义,同时每一配置项都有相应的类的定义,具体如下列所示:

ic15_resnet18_deform_thre.yaml:
在这里插入图片描述

(2)“base_dataset.yaml”: 定义了DBNet中数据集相关的配置,包括依赖的其它配置,需要用到的python包,以及训练集与验证集相关配置:数据集地址,加载数据集的类定义,数据增强类,数据增强参数等;

base_ic15.yaml:
在这里插入图片描述
(3)“base.yaml”: 基本的配置文件,数据集配置依赖的配置文件,配置了DBNet需要加载的python包。

base.yaml:
在这里插入图片描述

这里详细介绍下配置文件中define与源码的关系(以ic15_resnet18_deform_thre.yaml为例):
在这里插入图片描述

上图展示了DBNet源码中UML类图(仅仅包含一部分类),与配置文件define中的"name Experiment"对应。配置文件中"class"对应源码中的类名,位于“class”下面且同一级缩进的其它定义一般对应类中的成员属性,比如位于“class:Experiment”下方且与之同属于一个缩进级别的定义有“structure”, “train”, “validation”, “logger”, “evaluation”,这几个定义在源码类“Experiment”中都有对应的成员与之对应(见上图类模块-Experiment)

配置文件中对应源码的类大部分继承自类-Configuable,类Configuable元类方式继承StateMeta这一元类,元类StateMeta主要对继承Configuable的子类中State数据类型的成员进行过滤,即将子类中所有的State数据类型的成员映射到新定义的“states”成员属性中(dict类型),并修改原有State数据类型的成员类型:改变为State类型中default成员的类型。这里State类型类似c++ void 类型,经过配置文件的解析并构造对应类后将它转换为对应的实际数据类型。
在这里插入图片描述

关于元类的用法如果不清楚,大家可以在网上搜索下,这里主要是动态改变子类中成员的数据类型并添加新的成员states(dict类型)。所以如果大家看代码时发现类中用到了self.states成员却找不到定义和初始化的地方,这里可以解答你的疑惑。

2. 配置文件读取

源码中应用python 模块:anyconfig 来解读YAML配置文件,并按照dictory数据类型来存储YAML中的数据,应用munch模块将读取的dictory数据转换为Munch数据类型,这样在读取YAML配置文件中的数据时不用这样coding: conf[‘key’], 可以这样coding:conf.key。

源码中通过concern\config.py中定义的类Config来读取YAML配置文件,
在这里插入图片描述
这里简要介绍下Config类中每个函数的作用:
(1)load(): 读取配置文件内容存储到munch变量中并返回;
(2)compile(): 解析配置文件的内容,这里主要包括将配置文件中的import即依赖的配置文件进行加载并解析,通过python 加载配置文件中的package并保存,在加载的package中查找配置文件中的define中每一个“class”并替换为相对DBNet根目录的源码路径,比如class="Configuable"替换为class=“concern.Configuable”, concern为包含类Configuable的包名(目录名)。最后返回所有配置文件中package应用python加载后存储的结果list,以及所有配置文件define中“class”被修正后的存储结果dictory。
在这里插入图片描述
(3)compile_conf(): 配置文件中define是一个list,调用这个方法对list中每项进行解析,compile()调用这里函数来修正“class”的值。
(4)find_class_in_modules():compile_conf()调用这一函数确认define中“class”是否在python 加载的所有配置文件package中,如果在则用“模块名.类名”替换之前的类名,否则报错。

在train.py中调用Config类解析配置文件的代码如下:

	conf = Config()experiment_args = conf.compile(conf.load(args['exp']))['Experiment']

3. 构造并初始化配置文件中的类

这里以Experiment类的构造为例讲解源码中是如何根据配置文件中的类的信息来构造相应的类。

类的构造主要通过concern\config.py中Configurable类实现:
在这里插入图片描述
源码中定义的类基本都继承Configurable类,这里主要介绍Configurable类如何根据配置文件中的类信息构造相应的类。

根据配置文件中类的信息构造类主要通过Configurable类中静态方法:

	@staticmethoddef construct_class_from_config(args):cls = Configurable.extract_class_from_args(args)return cls(**args)

该静态方法的参数args为解析后的配置文件的数据(directory), 该方法调用Configurable类中另一个静态方法获取类并返回初始化后的类的对象。

    @staticmethoddef extract_class_from_args(args):cls = args.copy().pop('class')package, cls = cls.rsplit('.', 1)module = importlib.import_module(package)cls = getattr(module, cls)return cls

上述静态方法很简单,先从配置文件参数中获取class的信息,即"模块名.类名”,然后字符串分割分别得到模块名和类名,接着根据模块名应用python加载模块,最后根据类名查找模块中的属性并返回模块中对应的类。

如果上述构造函数返回Experiment类,则返回语句retrun cls(**args)会先执行Experiment类的对象初始化函数,然后才返回初始化后的Experiment对象。

class Experiment(Configurable):structure = State(autoload=False)train = State()validation = State(autoload=False)evaluation = State(autoload=False)logger = State(autoload=True)def __init__(self, **kwargs):self.load('structure', **kwargs)cmd = kwargs.get('cmd', {})if 'name' not in cmd:cmd['name'] = self.structure.model_nameself.load_all(**kwargs)self.distributed = cmd.get('distributed', False)self.local_rank = cmd.get('local_rank', 0)if cmd.get('validate', False):self.load('validation'

这篇关于DBnet源码解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/418081

相关文章

PostgreSQL的扩展dict_int应用案例解析

《PostgreSQL的扩展dict_int应用案例解析》dict_int扩展为PostgreSQL提供了专业的整数文本处理能力,特别适合需要精确处理数字内容的搜索场景,本文给大家介绍PostgreS... 目录PostgreSQL的扩展dict_int一、扩展概述二、核心功能三、安装与启用四、字典配置方法

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

Java中的雪花算法Snowflake解析与实践技巧

《Java中的雪花算法Snowflake解析与实践技巧》本文解析了雪花算法的原理、Java实现及生产实践,涵盖ID结构、位运算技巧、时钟回拨处理、WorkerId分配等关键点,并探讨了百度UidGen... 目录一、雪花算法核心原理1.1 算法起源1.2 ID结构详解1.3 核心特性二、Java实现解析2.

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图

深度解析Python装饰器常见用法与进阶技巧

《深度解析Python装饰器常见用法与进阶技巧》Python装饰器(Decorator)是提升代码可读性与复用性的强大工具,本文将深入解析Python装饰器的原理,常见用法,进阶技巧与最佳实践,希望可... 目录装饰器的基本原理函数装饰器的常见用法带参数的装饰器类装饰器与方法装饰器装饰器的嵌套与组合进阶技巧

解析C++11 static_assert及与Boost库的关联从入门到精通

《解析C++11static_assert及与Boost库的关联从入门到精通》static_assert是C++中强大的编译时验证工具,它能够在编译阶段拦截不符合预期的类型或值,增强代码的健壮性,通... 目录一、背景知识:传统断言方法的局限性1.1 assert宏1.2 #error指令1.3 第三方解决

全面解析MySQL索引长度限制问题与解决方案

《全面解析MySQL索引长度限制问题与解决方案》MySQL对索引长度设限是为了保持高效的数据检索性能,这个限制不是MySQL的缺陷,而是数据库设计中的权衡结果,下面我们就来看看如何解决这一问题吧... 目录引言:为什么会有索引键长度问题?一、问题根源深度解析mysql索引长度限制原理实际场景示例二、五大解决

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现

深度解析Spring AOP @Aspect 原理、实战与最佳实践教程

《深度解析SpringAOP@Aspect原理、实战与最佳实践教程》文章系统讲解了SpringAOP核心概念、实现方式及原理,涵盖横切关注点分离、代理机制(JDK/CGLIB)、切入点类型、性能... 目录1. @ASPect 核心概念1.1 AOP 编程范式1.2 @Aspect 关键特性2. 完整代码实