TAO toolkit 训练UNET 踩坑记录 解决mask与image无法对齐问题

2023-11-07 18:44

本文主要是介绍TAO toolkit 训练UNET 踩坑记录 解决mask与image无法对齐问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

先说结论,如果在使用TAO 训练Unet时候发生image与mask没有对齐(配对混乱),要自己写train_image.txt 那几个txt文件,注意文件内图片的顺序务必 train 的image 和mask 保持一致。

1. TAO框架白话介绍:

        TAO toolkit 简单来说是一个基于 tao(python端软件)+ nvidia docker(对应tao容器)的一个工具集合,主要用于跑模型训练、剪枝量化、模型输出、数据集处理的框架,优势是不用安装那么多依赖,只需要搭建一个nvidiadocker的环境请参考TAO Toolkit Quick Start Guide - NVIDIA Docs进行安装(请注意,nvidiadocker目前是2版本了,安装过程跟网上的可能不同)在拉起的容器内就可以做这些工作省去各种麻烦的依赖安装步骤。

        TAO框架有几个典型的容器 tensorflow2 tensorflow1 以及pytorch 三个(如果不是定制没啥区别,我本来用pytorch的,误拉起TF1的容器也是一样的操作没区别)

正文开始:

1. 安装的坑:

        1.1 如果你在标准UBUNTU上安装,可能会遇到docker启动时候需要sudo的问题,这块需要注意,如果不像每次启动都sudo需要上网查一下

        1.2 安装NGC时候 提示的password 实际上是生成的apikey 需要在提示的网址那边去生成一个。

2. 启动的坑:

        2.1 tao启动命令里的参数对应的文件路径,都是容器内的路径,不是本机路径哦

        2.2 在sudo情况下.tao_mounts.json 要放到/root文件夹下:   由于我这边没有root用户权限(只有sudo权限 不能su),每次启动tao时候都是用 sudo tao xx来启动的,在教程中将配置文件.tao_mounts.json 放到~/ 这一步 在我这里就变成了 要放到/root用户下 默认的~/ 是home文件夹  这里要注意,不然你会发现容器起来以后总说各种文件找不到。

3. NGC下载东西要科学 上 网...

4. 针对UNET 的坑:

        1. 数据集按照说明是有两种格式的(其实只有第二种能用) :1. 利用txt文件索引  2.按照预定的格式存放,这里注意,第二种我试过了,试了一周都不行,各种问题(主要是乱套了,mask跟image对不上),直接用 TXT文件索引,注意mask 和 image 这两个文件的顺序要对上。txt文件内的文件路径要是容器内的路径,这里要参考.tao_mounts.json的映射来确定路径哦!

        2. 配置 config.txt时候(教程里放到specs那个)的data_clase_config时候 label_id 要跟mask文件中的你要的部分的对应像素值对应 例如我的标注 黑色是背景,白色是要提取的东西 则需要这样写   data_class_config {
    target_classes {
      name: "foreground"
      mapping_class: "foreground"
      label_id: 255
    }
    target_classes {
      name: "background"
      mapping_class: "background"
      label_id: 0
    }
  }

如果单张MASK中有多个类别,则需要不同的类是不同像素值 例如 猫咪 狗狗 背景 则应该是 255 128 0 在这个mask文件中有三个值(不必是0就是背景,只要对应上就ok)。与cityscapes 标注类型中的 _idLabels.png中是一样的,在config中的target_classes的label_id 设置为 255 128 0 这三个值 

3. mask 对应的图片格式应该是 PIL图像中的"L" 而不是 "1" 

4. 在使用 三色图片时候 config 中 input_image_type: "color"

5. 在training_config中添加 visualizer{
                                                    enabled:true
                                              }  可以开启tensorboard 对debug很有用

这篇关于TAO toolkit 训练UNET 踩坑记录 解决mask与image无法对齐问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/365577

相关文章

使用TomCat,service输出台出现乱码的解决

《使用TomCat,service输出台出现乱码的解决》本文介绍了解决Tomcat服务输出台中文乱码问题的两种方法,第一种方法是修改`logging.properties`文件中的`prefix`和`... 目录使用TomCat,service输出台出现乱码问题1解决方案问题2解决方案总结使用TomCat,

解决Spring运行时报错:Consider defining a bean of type ‘xxx.xxx.xxx.Xxx‘ in your configuration

《解决Spring运行时报错:Considerdefiningabeanoftype‘xxx.xxx.xxx.Xxx‘inyourconfiguration》该文章主要讲述了在使用S... 目录问题分析解决方案总结问题Description:Parameter 0 of constructor in x

解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题

《解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题》文章详细描述了在使用lombok的@Data注解标注实体类时遇到编译无误但运行时报错的问题,分析... 目录问题分析问题解决方案步骤一步骤二步骤三总结问题使用lombok注解@Data标注实体类,编译时

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

Java循环创建对象内存溢出的解决方法

《Java循环创建对象内存溢出的解决方法》在Java中,如果在循环中不当地创建大量对象而不及时释放内存,很容易导致内存溢出(OutOfMemoryError),所以本文给大家介绍了Java循环创建对象... 目录问题1. 解决方案2. 示例代码2.1 原始版本(可能导致内存溢出)2.2 修改后的版本问题在

关于rpc长连接与短连接的思考记录

《关于rpc长连接与短连接的思考记录》文章总结了RPC项目中长连接和短连接的处理方式,包括RPC和HTTP的长连接与短连接的区别、TCP的保活机制、客户端与服务器的连接模式及其利弊分析,文章强调了在实... 目录rpc项目中的长连接与短连接的思考什么是rpc项目中的长连接和短连接与tcp和http的长连接短

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

golang1.23版本之前 Timer Reset方法无法正确使用

《golang1.23版本之前TimerReset方法无法正确使用》在Go1.23之前,使用`time.Reset`函数时需要先调用`Stop`并明确从timer的channel中抽取出东西,以避... 目录golang1.23 之前 Reset ​到底有什么问题golang1.23 之前到底应该如何正确的

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

linux报错INFO:task xxxxxx:634 blocked for more than 120 seconds.三种解决方式

《linux报错INFO:taskxxxxxx:634blockedformorethan120seconds.三种解决方式》文章描述了一个Linux最小系统运行时出现的“hung_ta... 目录1.问题描述2.解决办法2.1 缩小文件系统缓存大小2.2 修改系统IO调度策略2.3 取消120秒时间限制3