本文主要是介绍机器学习数据集半自动标注制作流程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
在制作机器学习数据集的时候,尤其是图片数据集的时候,可能会感到十分的繁琐,本文将介绍简化标注流程的一种思路。
1.收集数据集,清理数据集
2.手动标注部分数据集
3.将标注好的数据集用自己的模型训练
4.将未标注数据用模型进行预测,输出预测文件
5.将预测的数据重新导入标注工具,进行人工调整
接下来,介绍一个个人使用的,觉得比较方便标注工具CVAT
1.标注类型
边界框——识别追踪任务
多边形——分割任务
折线
点——用于标注姿势估计
2.标注格式
支持COCO,PASCAL VOC,YOLO…等多种数据格式的方便的导入导出。
3.标注辅助工具
(1) 边缘吸附
(2) 调节亮度
(3) 追踪
4.团队标注
(1)成员管理:成员注册,分组管理
(2)项目任务管理:添加项目,分发任务
5.相关链接
CAVT中文用户指南:https://blog.51cto.com/u_14691718/5063951
英文官方文档:https://openvinotoolkit.github.io/cvat//docs/
项目github地址:https://github.com/openvinotoolkit/cvat
这篇关于机器学习数据集半自动标注制作流程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!