Grounded-Segment-Anything实现自动文本标注

本文主要是介绍Grounded-Segment-Anything实现自动文本标注，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

项目地址：IDEA-Research/Grounded-Segment-Anything: Grounded-SAM: Marrying Grounding-DINO with Segment Anything & Stable Diffusion & Recognize Anything - Automatically Detect , Segment and Generate Anything (github.com)

demo地址：

automated-dataset-annotation-and-evaluation-with-grounding-dino-and-sam.ipynb - Colab (google.com)

一：进入上面的demo地址

1.1 连接GPU

1.2设置GPU

二：运行代码

三：查看文件夹

四：登录roboflow

4.1根据下面的提示创建数据集

4.2上传数据集，支持上传图片、文件夹、视频（YouTube）

4.3自动标注

4.4导出数据

4.5数据预处理

4.6数据导出的格式

五：测试说明

5.1图片测试

5.2视频测试

六：其他说明

一：进入上面的demo地址

进入之后是这样的

1.1 连接GPU

这边显示已连接，就代表连接了

1.2设置GPU

可以自己设置GPU的型号

二：运行代码

既可以逐步点击每段代码旁边的按扭键，逐步执行代码

也可以点击全部运行,一步到位。

三：查看文件夹

旁边有一个文件夹，会随着代码的执行情况，添加模块，方便大家了解整个代码部分。

接下来输入roboflow的授权token，它将自动添加数据集到你的workspace

roboflow的一个数据集的网站，在上面创建数据集和管理数据集非常的方便。

下面可能会出现报错，所以将视角转向roboflow的官网，进行接下来的操作。

四：登录roboflow

Workspace Home (roboflow.com)

登录之前需要注册一个谷歌账号

然后创建一个项目（数据集）

4.1根据下面的提示创建数据集

4.2上传数据集，支持上传图片、文件夹、视频（YouTube）

4.3自动标注

上传完数据集之后，就可以可以自动标注了

4.4导出数据

数据集标注完之后，可以自己再去微调，觉得没问题之后就选择接收，然后全部加载到数据集之中。

4.5数据预处理

可以自定义图片导出的尺寸，还可以支持数据的增强。

4.6数据导出的格式

roboflow支持多种数据导出的格式，方便我们去根据需求去训练。

若是正常的YOLO格式，选择YOLO Darknet格式就可以了。

五：测试说明

5.1图片测试

在数据进行自动标注的阶段，会有一个prompt可以支持输入，如果做的是目标检测工作的话，prompt输入object就可以了。

如果是偏向应用方面的话，建议还是偏向描述更加详细会更好一些。

5.2视频测试

需要导入YouTube的视频链接，可以选择每秒抽多少帧进行识别，效果方面的话，也是prompt描述偏向一句话会比单个object的效果更好。

下图是输入prompt为fire的标注效果

下面这张图的prompt是 a forest is on fire 识别效果明显比上面的效果好太多了。

六：其他说明

比较局限的就是现在roboflow只支持每个账号每个月1000张图片的自动标注，后续会更新在自己的电脑部署的教程。

这篇关于Grounded-Segment-Anything实现自动文本标注的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

Grounded-Segment-Anything实现自动文本标注

一：进入上面的demo地址

1.1 连接GPU

1.2设置GPU

二：运行代码

三：查看文件夹

四：登录roboflow

4.1根据下面的提示创建数据集

4.2上传数据集，支持上传图片、文件夹、视频（YouTube）

4.3自动标注

4.4导出数据

4.5数据预处理

4.6数据导出的格式

五：测试说明

5.1图片测试

5.2视频测试

六：其他说明

相关文章

SpringBoot3实现Gzip压缩优化的技术指南

SpringBoot实现数据库读写分离的3种方法小结

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

Java枚举类实现Key-Value映射的多种实现方式

使用Python实现快速搭建本地HTTP服务器

MySQL双主搭建+keepalived高可用的实现

Java实现文件图片的预览和下载功能

使用Sentinel自定义返回和实现区分来源方式

Java实现时间与字符串互相转换详解

opencv图像处理之指纹验证的实现