runner.logger.info(‘loss become infinite or NaN

2024-01-31 06:30

本文主要是介绍runner.logger.info(‘loss become infinite or NaN,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在使用mmdetection训练的时候出现了如下错误:

2022-05-07 21:35:13,488 - mmdet - INFO - Epoch [1][50/5111]     lr: 1.978e-04, eta: 18:35:19, time: 0.546, data_time: 0.217, memory: 1781, loss_cls: 17.7358, loss_bbox: 4.1217, loss: 21.8
575
2022-05-07 21:35:24,322 - mmdet - INFO - Epoch [1][100/5111]    lr: 3.976e-04, eta: 12:58:42, time: 0.217, data_time: 0.003, memory: 1781, loss_cls: 13.2629, loss_bbox: 4.4149, loss: 17.6
778
2022-05-07 21:35:35,155 - mmdet - INFO - Epoch [1][150/5111]    lr: 5.974e-04, eta: 11:06:25, time: 0.217, data_time: 0.003, memory: 1781, loss_cls: 9.6519, loss_bbox: 4.5696, loss: 14.22
16
2022-05-07 21:35:45,901 - mmdet - INFO - Epoch [1][200/5111]    lr: 7.972e-04, eta: 10:09:16, time: 0.215, data_time: 0.003, memory: 1781, loss_cls: 13.5727, loss_bbox: 5.6242, loss: 19.1
969runner.run(data_loaders, cfg.workflow)File "D:\ProgramData\Anaconda3\envs\mytorch\lib\site-packages\mmcv\runner\epoch_based_runner.py", line 127, in runepoch_runner(data_loaders[i], **kwargs)File "D:\ProgramData\Anaconda3\envs\mytorch\lib\site-packages\mmcv\runner\epoch_based_runner.py", line 51, in trainself.call_hook('after_train_iter')File "D:\ProgramData\Anaconda3\envs\mytorch\lib\site-packages\mmcv\runner\base_runner.py", line 309, in call_hookgetattr(hook, fn_name)(self)File "D:\ProgramData\Anaconda3\envs\mytorch\lib\site-packages\mmdet-2.24.1-py3.7.egg\mmdet\core\hook\checkloss_hook.py", line 24, in after_train_iterrunner.logger.info('loss become infinite or NaN!')
AssertionError: None

出现这个问题是因为学习率太大了,需要降低学习率;
在这里插入图片描述
把学习率改为2e-4就可以解决问题了。

这篇关于runner.logger.info(‘loss become infinite or NaN的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/662849

相关文章

Jackson库进行JSON 序列化时遇到了无限递归(Infinite Recursion)的问题及解决方案

《Jackson库进行JSON序列化时遇到了无限递归(InfiniteRecursion)的问题及解决方案》使用Jackson库进行JSON序列化时遇到了无限递归(InfiniteRecursi... 目录解决方案‌1. 使用 @jsonIgnore 忽略一个方向的引用2. 使用 @JsonManagedR

linux报错INFO:task xxxxxx:634 blocked for more than 120 seconds.三种解决方式

《linux报错INFO:taskxxxxxx:634blockedformorethan120seconds.三种解决方式》文章描述了一个Linux最小系统运行时出现的“hung_ta... 目录1.问题描述2.解决办法2.1 缩小文件系统缓存大小2.2 修改系统IO调度策略2.3 取消120秒时间限制3

Python中处理NaN值的技巧分享

《Python中处理NaN值的技巧分享》在数据科学和数据分析领域,NaN(NotaNumber)是一个常见的概念,它表示一个缺失或未定义的数值,在Python中,尤其是在使用pandas库处理数据时,... 目录NaN 值的来源和影响使用 pandas 的 isna()和 isnull()函数直接比较 Na

使用@Slf4j注解,log.info()无法使用问题

《使用@Slf4j注解,log.info()无法使用问题》在使用Lombok的@Slf4j注解打印日志时遇到问题,通过降低Lombok版本(从1.18.x降至1.16.10)解决了问题... 目录@Slf4androidj注解,log.info()无法使用问题最后解决总结@Slf4j注解,log.info(

在JavaScript当中,为什么NaN===NaN和NaN==NaN返回false?

作者:CSDN-PleaSure乐事 欢迎大家阅读我的博客 希望大家喜欢 使用环境:vscode chrome 今天这个话题的缘由是早上和一位同专业的学长聊天,他在公司完成了一个项目,项目当中有一个40个字段的返回值,于是牵扯到了某道他遇到的面试题,其中是需要用js找到某个数组当中null的索引,然后他问了我这样一个问题:你觉得NaN===NaN吗?当时我回答了不等于,然后他又追问为什么,

j2ee项目 web-info目录问题

1、资源文件只能放在WebContent下面,如 CSS,JS,image等.放在WEB-INF下引用不了.   2、页面放在WEB-INF目录下面,这样可以限制访问,提高安全性.如JSP,html   3、只能用转向方式来访问WEB-INF目录下的JSP,不用采用重定向的方式请求该目录里面的任何资源.如图:index.jsp>>  main.jsp   4、WEB-INF

ElementPlusError: [ElForm] unexpected width NaN 解决方法

我自己在使用 Vue 和 ElementPlus 开发项目时,当切换到某些页面时,控制台会出现如下错误: 经过分析,问题原因如下: • el-form 组件设置了 label-width=“auto”,并且该组件处于隐藏状态(例如被 display: none 隐藏,项目中是由于 el-tab 组件的切换导致的)。 • 当切换页面时,这个隐藏的表单组件会引发问题。具体来说,el-form 组

Face Recognition简记1-A Performance Comparison of Loss Functions for Deep Face Recognition

创新点 1.各种loss的比较 总结 很久没见到这么专业的比较了,好高兴。 好像印证了一句话,没有免费的午餐。。。。 ArcFace 和 Angular Margin Softmax是性能比较突出的

log4j:WARN No appenders could be found for logger解决方法

问题: log4j:WARN No appenders could be found for logger(org.springframework.web.context.ContextLoader). log4j:WARN Please initialize the log4j system properly.     未找到log4j,未初始化log4j。 解决方法: <!-- 以下

【读论文】MUTUAL-CHANNEL LOSS

论文题目:《The Devil is in the Channels: Mutual-Channel Loss for Fine-Grained Image Classification》 链接:https://arxiv.org/abs/2002.04264 来源:IEEE TIP2020 细粒度分类的主要思想是找出各个子类间的可区分特征,因此文章指出要尽早在通道上进行钻研,而不是从合并