数据集标注工具anylabeling解析

2024-02-04 01:04

本文主要是介绍数据集标注工具anylabeling解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近帮助其他课题组的学姐标注数据集,课题组使用的是anylabeling软件,相比于其他数据标注软件,例如labelme等,anylabeling软件使用时可以选择不同的模型,可以做到在图片上点几个点的轮廓,模型将自动识别出大致轮廓,可以大大节省时间,提高效率。
视频教程:https://www.bilibili.com/video/BV1mN411C7SC/?spm_id_from=333.788.recommend_more_video.1&vd_source=a37ca5b14367044bc8b8c9408ba13218

软件使用概述:
1.软件下载
代码和模型的下载都需要链接github,如果没有梯子可能速度太慢,下载不了模型,可以直接创建一个文件夹【路径不含有中文】存放anylabeling.exe,然后将medels文件夹复制到:C:\Users\用户名\anylabeling_data文件夹下,打开anylabeling.exe,选择工作文件夹,模型选择时选:segment anything(vit-l)【提供的models文件夹内指下载了该模型,因此如果用提供的models文件夹只能选用这个模型,别的模型需要另外下载。
网盘:
链接:https://pan.baidu.com/s/1TxqM0E-PIJC-w3VcaFqMPw?pwd=gtvv
提取码:gtvv
–来自百度网盘超级会员V5的分享

有特殊情况or想自己配置
1、创建一个文件夹anylabel放软件(路径不要有中文)
建议到网页安装软件 有gpu选择AnyLabeling-GPU.exe
pip install 可能失败
https://github.com/vietanhdev/anylabeling/releases
在这里插入图片描述
2、启动软件点击Auto-Labeling,选择模型,会自动下载到C:\Users\用户名\anylabeling_data下【此步骤如果出现闪退状况很可能是因为没有梯子】
在这里插入图片描述
软件的具体使用方法可以参考上面的视频教程,讲述的比较详细,下面mark一些常用快捷键:
A D :上一张 下一张
Ctrl+滚轮:放大缩小
f:保存并打标签名
backspace:删除多边形边框的点

标注生成的是json格式的文件,提供一个脚本来整合json文件和原图,结果是全黑的,如果想要查看标注结果,可以将代码中的注释放入代码中,标注的类别等信息可以根据自身的情况更改:

'''
把Anylabeling标注得到的json文件
转化成mask灰度图用于语义分割
0-背景 1-5类别:砖块brick,金属metal,石头stone,塑料plastic,木头wood
'''
import json
import argparse
import os
import os.path as osp
import warnings
import numpy as np
import PIL.Image
import yaml
from labelme import utils
import cv2
# 显示彩色的分割结果
# def show_img(img_gray):
#     img_show = np.zeros((height, width, 3), np.uint8)
#     for i in range(height):
#         for j in range(width):
#             if(img_gray[i, j] == 1):
#                 img_show[i, j, 0] = 255
#                 img_show[i, j, 1] = 0
#                 img_show[i, j, 2] = 0
#             elif(img_gray[i, j] == 2):
#                 img_show[i, j, 0] = 0
#                 img_show[i, j, 1] = 255
#                 img_show[i, j, 2] = 0
#             elif(img_gray[i, j] == 3):
#                 img_show[i, j, 0] = 255
#                 img_show[i, j, 1] = 255
#                 img_show[i, j, 2] = 0
#             elif(img_gray[i, j] == 4):
#                 img_show[i, j, 0] = 0
#                 img_show[i, j, 1] = 0
#                 img_show[i, j, 2] = 255
#     cv2.imshow('1', img_show)
#     cv2.waitKey()if __name__ == '__main__':# 类别对应labelname_to_label = {'Metal': 1, 'Plastic': 2, 'Stone': 3, 'Wood': 4,'stone':5}# 保存json的文件夹json_file_path = 'D:/datalabel/8'# 保存label图片的文件夹save_path = 'D:/datalabel/'list = os.listdir(json_file_path)for json_file in list:print(json_file)if(os.path.basename(json_file.split('.')[1]) != 'json'):print('文件{}不是json文件,跳过'.format(json_file))continue# print(json_file)img_name = json_file.split('.')[0]+'.png'file_path = os.path.join(json_file_path, json_file)# 打开每个json文件遍历with open(file_path, 'r', encoding='utf8') as fp:data = json.load(fp)height = data['imageHeight']width = data['imageWidth']lbl, lbl_names = utils.shapes_to_label((height, width), data['shapes'], name_to_label)# 显示彩色分割图# show_img(lbl)cv2.imwrite(save_path+img_name, lbl)

这篇关于数据集标注工具anylabeling解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/675957

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只