openpcdet中的优化器

2024-02-05 13:28
文章标签 优化 openpcdet

本文主要是介绍openpcdet中的优化器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

OPTIMIZATION

优化器用于对梯度、学习率等进行调整
下面是一个优化器的配置:

OPTIMIZATION:BATCH_SIZE_PER_GPU: 4NUM_EPOCHS: 10OPTIMIZER: adam_onecycleLR: 0.001WEIGHT_DECAY: 0.04MOMENTUM: 0.8MOMS: [0.85, 0.75]PCT_START: 0.1DIV_FACTOR: 100DECAY_STEP_LIST: [35, 45]LR_DECAY: 0.1LR_CLIP: 0.0000001LR_WARMUP: FalseWARMUP_EPOCH: 1GRAD_NORM_CLIP: 10LOSS_SCALE_FP16: 32.0

下面来看每个配置的具体作用和含义:
按照配置的功能,可以分为以下几组:

  • 首先是batch_sizeepoch

    BATCH_SIZE_PER_GPU: 4 # 表示每个GPU上一次迭代的batch size 是4
    NUM_EPOCHS: 10 # 表示一共训练10个epoch

  • 然后是Optimizer(优化器)

    OPTIMIZER: adam_onecycle # 表示使用的优化器是adam_onecycle
    LR: 0.001 # 表示初始学习率是0.001
    WEIGHT_DECAY: 0.04 # 表示权重衰减系数是 0.04
    MOMENTUM: 0.8 # 表示MOMENTUM是0.8, SGD算法需要,其他不需要

  • 然后是Scheduler(学习率调度器)

参考:https://blog.csdn.net/ChuiGeDaQiQiu/article/details/121462371
MOMS: [0.95, 0.85]
PCT_START: 0.1
DIV_FACTOR: 100
DECAY_STEP_LIST: [35, 45]
LR_DECAY: 0.1
LR_CLIP: 0.0000001
LR_WARMUP: False
WARMUP_EPOCH: 1

  • 梯度裁剪clip_grad_norm_

GRAD_NORM_CLIP: 10
LOSS_SCALE_FP16: 32.0

下面对各个功能组件进行具体分析:
batch_size 和 epoch数比较简单,没啥好说的

下面来看Optimizer(优化器)

怎么构造

Optimizer在train.py中通过
build_optimizer(model, optim_cfg, filter_frozen_params=False) 函数进行构造

def build_optimizer(model, optim_cfg, filter_frozen_params=False):if optim_cfg.OPTIMIZER == 'adam':optimizer = optim.Adam(model.parameters(), lr=optim_cfg.LR, weight_decay=optim_cfg.WEIGHT_DECAY)elif optim_cfg.OPTIMIZER == 'sgd':optimizer = optim.SGD(model.parameters(), lr=optim_cfg.LR, weight_decay=optim_cfg.WEIGHT_DECAY,momentum=optim_cfg.MOMENTUM)elif optim_cfg.OPTIMIZER in ['adam_onecycle','adam_cosineanneal']:def children(m: nn.Module):return list(m.children())def num_children(m: nn.Module) -> int:return len(children(m))flatten_model = lambda m: sum(map(flatten_model, m.children()), []) if num_children(m) else [m]get_layer_groups = lambda m: [nn.Sequential(*flatten_model(m))]betas = optim_cfg.get('BETAS', (0.9, 0.99))betas = tuple(betas)optimizer_func = partial(optim.Adam, betas=betas)optimizer = OptimWrapper.create(optimizer_func, 3e-3, get_layer_groups(model), wd=optim_cfg.WEIGHT_DECAY, true_wd=True, bn_wd=True)else:raise NotImplementedErrorreturn optimizer

不同的Optimizer有不同的构造方法,openpcdet中提供了adam、sgd、adam_onecycle、adam_cosineanneal这几种Optimizer,这里不对Optimizer做具体解释,放在另外一个文档中进行具体分析

怎么使用

优化器的使用涉及到两方面:
一是使用优化器进行梯度更新
二是构造学习率调整器,由学习率调整器对优化器进行更新

首先来看使用优化器进行梯度更新
def train_one_epoch(..., optimizer, ...):... 忽略一堆代码# 混合精度训练的缩放操作scaler = torch.cuda.amp.GradScaler(enabled=use_amp, init_scale=optim_cfg.get('LOSS_SCALE_FP16', 2.0 ** 16))... 忽略一堆代码lr_scheduler.step(accumulated_iter, cur_epoch)  # 学习率调整try:cur_lr = float(optimizer.lr)    # 读取当前的学习率,用于日志显示except:cur_lr = optimizer.param_groups[0]['lr']if tb_log is not None:tb_log.add_scalar('meta_data/learning_rate', cur_lr, accumulated_iter)model.train()optimizer.zero_grad()      # 梯度清零with torch.cuda.amp.autocast(enabled=use_amp):loss, tb_dict, disp_dict = model_func(model, batch)scaler.scale(loss).backward()  # 如果不用混合精度训练,直接loss.backward()就行,进行方向传播计算scaler.unscale_(optimizer)     # 将优化器中的梯度反向缩放回原始的 FP32 精度clip_grad_norm_(model.parameters(), optim_cfg.GRAD_NORM_CLIP)   # 梯度裁剪,用于限制梯度的范数,防止梯度爆炸的情况发生scaler.step(optimizer)  # 使用优化器来更新模型的参数。由于之前已经对梯度进行了缩放处理,因此这里直接调用 step() 方法来执行参数更新scaler.update() # 用于更新 AMP 的内部状态,以便在下一次迭代中使用正确的缩放因子... 忽略一堆代码
然后看构造学习率调整器

将上面构造好的optimizer作为参数传入 build_scheduler() 函数,用于构造学习率调整器
然后构造好的学习率调整器在每次迭代调用lr_scheduler.step(accumulated_iter, cur_epoch) 进行学习率调整

下面来看Scheduler(学习率调度器)

怎么构造

在build_scheduler() 函数中进行构造:

def build_scheduler(optimizer, total_iters_each_epoch, total_epochs, last_epoch, optim_cfg):decay_steps = [x * total_iters_each_epoch for x in optim_cfg.DECAY_STEP_LIST]def lr_lbmd(cur_epoch):cur_decay = 1for decay_step in decay_steps:if cur_epoch >= decay_step:cur_decay = cur_decay * optim_cfg.LR_DECAYreturn max(cur_decay, optim_cfg.LR_CLIP / optim_cfg.LR)lr_warmup_scheduler = Nonetotal_steps = total_iters_each_epoch * total_epochsif optim_cfg.OPTIMIZER == 'adam_onecycle':lr_scheduler = OneCycle(optimizer, total_steps, optim_cfg.LR, list(optim_cfg.MOMS), optim_cfg.DIV_FACTOR, optim_cfg.PCT_START)elif optim_cfg.OPTIMIZER == 'adam_cosineanneal':lr_scheduler = CosineAnnealing(optimizer, total_steps, total_epochs, optim_cfg.LR, list(optim_cfg.MOMS), optim_cfg.PCT_START, optim_cfg.WARMUP_ITER)else:lr_scheduler = lr_sched.LambdaLR(optimizer, lr_lbmd, last_epoch=last_epoch)if optim_cfg.LR_WARMUP:lr_warmup_scheduler = CosineWarmupLR(optimizer, T_max=optim_cfg.WARMUP_EPOCH * len(total_iters_each_epoch),eta_min=optim_cfg.LR / optim_cfg.DIV_FACTOR)return lr_scheduler, lr_warmup_scheduler

最后返回 lr_scheduler, lr_warmup_scheduler , 分别是学习率调度器和学习率warmup调度器(LR_WARMUP=True时)

怎么使用

学习率调度器用法很简单:
只要在每次迭代中传入当前的迭代次数和当前的epoch数,调用step函数就可以更新学习率了
lr_scheduler.step(accumulated_iter, cur_epoch)

下面来看梯度裁剪

梯度裁剪使用比较简单:
调用函数就可以:
clip_grad_norm_(model.parameters(), optim_cfg.GRAD_NORM_CLIP)

这篇关于openpcdet中的优化器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/681054

相关文章

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis

MyBatis 动态 SQL 优化之标签的实战与技巧(常见用法)

《MyBatis动态SQL优化之标签的实战与技巧(常见用法)》本文通过详细的示例和实际应用场景,介绍了如何有效利用这些标签来优化MyBatis配置,提升开发效率,确保SQL的高效执行和安全性,感... 目录动态SQL详解一、动态SQL的核心概念1.1 什么是动态SQL?1.2 动态SQL的优点1.3 动态S

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

一文详解SpringBoot响应压缩功能的配置与优化

《一文详解SpringBoot响应压缩功能的配置与优化》SpringBoot的响应压缩功能基于智能协商机制,需同时满足很多条件,本文主要为大家详细介绍了SpringBoot响应压缩功能的配置与优化,需... 目录一、核心工作机制1.1 自动协商触发条件1.2 压缩处理流程二、配置方案详解2.1 基础YAML

MySQL中慢SQL优化的不同方式介绍

《MySQL中慢SQL优化的不同方式介绍》慢SQL的优化,主要从两个方面考虑,SQL语句本身的优化,以及数据库设计的优化,下面小编就来给大家介绍一下有哪些方式可以优化慢SQL吧... 目录避免不必要的列分页优化索引优化JOIN 的优化排序优化UNION 优化慢 SQL 的优化,主要从两个方面考虑,SQL 语

MySQL中慢SQL优化方法的完整指南

《MySQL中慢SQL优化方法的完整指南》当数据库响应时间超过500ms时,系统将面临三大灾难链式反应,所以本文将为大家介绍一下MySQL中慢SQL优化的常用方法,有需要的小伙伴可以了解下... 目录一、慢SQL的致命影响二、精准定位问题SQL1. 启用慢查询日志2. 诊断黄金三件套三、六大核心优化方案方案

Redis中高并发读写性能的深度解析与优化

《Redis中高并发读写性能的深度解析与优化》Redis作为一款高性能的内存数据库,广泛应用于缓存、消息队列、实时统计等场景,本文将深入探讨Redis的读写并发能力,感兴趣的小伙伴可以了解下... 目录引言一、Redis 并发能力概述1.1 Redis 的读写性能1.2 影响 Redis 并发能力的因素二、

使用国内镜像源优化pip install下载的方法步骤

《使用国内镜像源优化pipinstall下载的方法步骤》在Python开发中,pip是一个不可或缺的工具,用于安装和管理Python包,然而,由于默认的PyPI服务器位于国外,国内用户在安装依赖时可... 目录引言1. 为什么需要国内镜像源?2. 常用的国内镜像源3. 临时使用国内镜像源4. 永久配置国内镜

C#原型模式之如何通过克隆对象来优化创建过程

《C#原型模式之如何通过克隆对象来优化创建过程》原型模式是一种创建型设计模式,通过克隆现有对象来创建新对象,避免重复的创建成本和复杂的初始化过程,它适用于对象创建过程复杂、需要大量相似对象或避免重复初... 目录什么是原型模式?原型模式的工作原理C#中如何实现原型模式?1. 定义原型接口2. 实现原型接口3