本文主要是介绍数据集图片数据标记工具Labelimg,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
我们知道,图片标注主要是用来创建自己的数据集,方便进行深度学习训练。本文将推荐一款十分好用的图片标注工具LabelImg,重点介绍其安装以及使用的过程。
本文使用的window10的Anaconda3下使用python3和pyqt5的组合,运行labelImg。首先从网址下载源码:https://github.com/tzutalin/labelImg。解压到想放的路径,得到labelimg-master文件夹。
进入Anaconda3下的prompt命令行,安装lxml和pyqt5。
pip install lxml
conda install pyqt=5
将labelImg-master\data文件夹下的predefined_classes.txt更改为需要标注的类。命令行进入文件夹下,运行以下命令打开labelImg。
pyrcc5 -o resources.py resources.qrc
python labelImg.py
界面如下图所示:
以标注名为image_0568.JPG的图像为例,使用labelImg标记得到类和标注信息。按照循序依次操作1到7步。
第一步,选择图片路径;第二步,选择标注信息文件xml文件保存路径;第三步,创建边界框;第四步,边界框框定目标范围;第五步,选择目标类型;第六步,保存xml文件;第七步,下一张图片。
边界框坐标都构建在像素层面上。边界框通常使用(xmin,ymin,xmax,ymax)的四维向量表示,对应下图即(190,181,306,319)。
手动标记图片中目标位置后,输出XML文件。打开image_0568.xml文件,得到目标位置的像素信息。发现其格式与PASCAL VOC以及ImageNet用的XML格式相同。
如果要从xml文件中批量获取边界框信息,可以使用python解析xml文件,包括SAX和DOM,具体方法任君选择咯!
更多的文章可以关注公众号查看。
这篇关于数据集图片数据标记工具Labelimg的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!