业界最全遥感图像语义分割Benchmark发布啦!还有提高小目标分割性能的C2FNet等你pick!

本文主要是介绍业界最全遥感图像语义分割Benchmark发布啦!还有提高小目标分割性能的C2FNet等你pick!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

遥感图像语义分割是图像分割领域的一个重要的垂类应用,有着广泛的需求和实际应用价值,尤其在灾害评估、农作物产量估计和土地变化监测等领域有着不可替代的作用。相比于自然图像的语义分割,遥感图像语义分割由于有其自身的特殊性和挑战性,如遥感图像存在大量微小目标,这就要求分割方法和结果要足够精细。
自然图像和遥感图像对比
自然图像和遥感图像对比

基于飞桨PaddleSeg的遥感图像分割Benchmark

近年来,随着人工智能技术的发展,深度学习成为图像语义分割领域的主流技术。但由于遥感图像预处理、模型设置、训练超参数等条件的不同,导致很多研究者在同一个遥感语义分割数据集上取得的表现会存在较大的差异。为了解决这个问题,飞桨与百度研究院大数据实验室合作,基于飞桨图像分割套件PaddleSeg,联合发布了一套完整的遥感图像分割Benchmark。我们测试了不同模型在多个遥感图像语义分割数据集上的性能,为广大开发者提供了一套可复现比较的标准基线。和已经发表的遥感图像语义分割模型相比,PaddleSeg提供的模型在遥感图像语义分割领域可以取得SOTA性能,部分性能数据如下所示。

  • 以下性能数据均来自:
    https://github.com/PaddlePaddle/PaddleSeg
     不同模型在iSAID数据集上的表现
    不同模型在iSAID数据集上的表现
    在这里插入图片描述
    不同模型在ISPRS Potsdam数据集上的表现
    在这里插入图片描述不同模型在ISPRS Vaihingen数据集上的表现

**

自监督预训练模型性能比较

**

此次,我们还引入了近期比较流行的自监督预训练模型,即首先在大规模遥感图像数据集上对骨干网络进行预训练,然后利用遥感图像语义分割数据在下游任务上进行微调。我们在Million-AID和DOTA2.0两个遥感图像数据集上应用自监督学习方法。为了获得充足的遥感数据,我们将两个遥感数据集内不同分辨率的图像剪裁至512x512。剪裁后的Million-AID数据集包含2,500,000张遥感图像切片,DOTA2.0数据集包含1,700,000张遥感图像切片,最终各方法性能数据如下所示。

  • 以下性能数据均来自:
    https://github.com/PaddlePaddle/PaddleSeg
    在这里插入图片描述
    基于ImageNet-1k的自监督预训练模型在遥感图像分割任务上的表现
    在这里插入图片描述
    基于遥感图像的自监督预训练模型在遥感图像分割任务上的表现

遥感图像小目标分割模型C2FNet

针对遥感图像语义分割的小目标问题,我们提出了一个由粗粒度到细粒度的二阶段分割模型C2FNet。受到人工标注过程的启发,C2FNet首先对遥感图像进行一次粗分割,并通过粗分割结果定位出小目标所在区域,然后对小目标所在的区域进行放大和进一步的细分割,最后对两次分割结果进行融合,从而提升小目标分割能力。如图7所示是CFNet模型结构示意。
图片
C2FNet模型示意图

C2FNet在主流遥感图像分割数据集iSAID上取得小目标分割SOTA性能。相比于基线模型,C2FNet对小目标如小型车辆、船舶、直升机等类别,mIoU最高提升可达2.19个百分点。并且C2FNet架构具有通用性,可适用于各种语义分割模型,对小目标分割结果均有不同程度的提升。

在这里插入图片描述
C2FNet在iSAID数据集上的表现。with ours表示采用C2FNet架构

注:SH表示船舶、LV表示大型车辆、SV表示小型车辆、HC表示直升机、SP表示游泳池、PL表示飞机、HA表示港口。
图片
分割结果可视化

通过上图,我们可以看出C2FNet可以分割出更多的小目标像素,缓解基线模型对小目标分割能力不足的问题。

总结

针对遥感图像分割领域基线不统一的问题,我们利用PaddleSeg在不同的遥感分割数据集上进行了测试,提供了可比较的SOTA基线,完善了PaddleSeg对遥感图像的支持。同时引入近期比较流行的自监督预训练模型,给广大开发者提供了更多的选择。针对遥感图像的小目标分割问题,我们提出了C2FNet二阶段分割框架,在小目标分割任务上取得SOTA性能。

本次提供的模型在PaddleSeg仓库的develop分支下可下载,欢迎star支持!

https://github.com/PaddlePaddle/PaddleSeg/tree/develop/contrib/RSSegBenchmark

小伙伴们还在等什么,一起用PaddleSeg玩转遥感图像分割吧~

关注【飞桨PaddlePaddle】公众号获取更多技术内容~

这篇关于业界最全遥感图像语义分割Benchmark发布啦!还有提高小目标分割性能的C2FNet等你pick!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/841726

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星

uva 10916 Factstone Benchmark(打表)

题意是求 k ! <= 2 ^ n ,的最小k。 由于n比较大,大到 2 ^ 20 次方,所以 2 ^ 2 ^ 20比较难算,所以做一些基础的数学变换。 对不等式两边同时取log2,得: log2(k ! ) <=  log2(2 ^ n)= n,即:log2(1) + log2(2) + log2 (3) + log2(4) + ... + log2(k) <= n ,其中 n 为 2 ^

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快