显著性检测论文详解(一):BASNet: Boundary-Aware Salient Object Detection

本文主要是介绍显著性检测论文详解(一):BASNet: Boundary-Aware Salient Object Detection,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

BASNet: Boundary-Aware Salient Object Detection

简述:

对于显著性目标检测,以往的研究大多集中在区域精度上,而不是边界质量上。在这篇论文中,我们提出了一种predict-refine architecture,BASNet,以及一种新的混合损耗来实现边界感知的突出对象的设计。

问题or相关工作:在这里插入图片描述

由上图,可以看到现在的方法(FCN等),预测的显著性图在精细结构和/或边界上仍然有缺陷,显著性预测目标主要存在两个挑战,①需要聚合多层次深度特征来获取整个图像的全局意义。②交叉熵损失容易造成边界模糊。
  作者使用新的残差模块与U-Net编码器网络相结合,在Encoder-Decoder网络后面连接细化模块改进预测地图。并提出混合交叉损失(BCE、SSIM、IoU)来提高置信度显著图和清晰地边界。

模型:

整体框架:

在这里插入图片描述
  该架构由一个密集监督的编译码网络和一个残差细化模块组成,分别负责显著性预测和显著性映射细化。经典的Encode-Decode网络, predict网络的结构更加深一些,而fine网络则浅一些。前面的Encode对图像进行提取特征,使用Pooling方法得到了分辨率逐步变小的高层语义特征,后面的Decode部分则负责将高层语义信息逐步还原放大,从而逐步获得大分辨率的feature map图,最终输出和原图一样大小的显著性图。
  在Encode和Decode之间,会有shortcut,将相同分辨率的feature map图相加,从而让最终的输出的feature map能够兼顾low-level和high-level的特征。除此之外, 在decode的过程中,共有 6 种不同分辨率的feature map图,再加上encode阶段最后一层的feature map,一共使用了7个feature map进行loss算,这种多层多loss的方法有点类似于中继loss,一方面可以帮助网络更好的收敛,另一方面可以让网络关注到不同尺度的显著性图。为了细化粗糙显著性映射中的区域和边界缺陷,作者提出的一种新的剩余细化模型如下图c(总框图的右侧)
在这里插入图片描述
混合Loss
  混合损耗通过融合二进制交叉方向(BCE)、结构相似度(SSIM)和交叉过并(IoU)损耗,引导网络在像素级、patch级和map级三个层次上学习输入图像与地面真实值之间的转换。总的loss等于每层的loss的加权和:
在这里插入图片描述
  每层的loss又由三部分loss组成:
在这里插入图片描述
BCE Loss(其中r,c表示像素坐标,G为真值,S为预测值),因此是pixel-level的loss: 在这里插入图片描述
Ssim Loss其中,x,y集合表示示从预测的显著性图和groundtruth上抠出的NN区域。 μ_x,μ_y,σ_x,σ_y,σ_xy分别为x和y的均值、方差、协方差。*
在这里插入图片描述  每个像素点的产生的loss都与其附近的局部patch有关(这里是N*N的patch),因此在训练的过程中,会对物体边缘部分的loss值加强,对非边缘部分抑制。正式因为这个loss的存在,使得该算法可以关注到更多的目标显著性的边缘细节信息。

IoU Loss:S、G和BCE loss的含义是一样的。
在这里插入图片描述在这里插入图片描述
  上图可以看到,利用BCE来保持一个平滑的梯度所有像素,而使用IoU给更多的重点在前景。SSIM是用来鼓励预测尊重原始图像的结构,使得边界更加的清晰。

实验:

消融实验:在这里插入图片描述
与其他方法的对比:
在这里插入图片描述  可以看到作者提出的方法在显著性检测常见的是数据集上都取得了不错的成果,具有泛化能力,并且检测的边缘更加清晰。

这篇关于显著性检测论文详解(一):BASNet: Boundary-Aware Salient Object Detection的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/745911

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

OpenHarmony鸿蒙开发( Beta5.0)无感配网详解

1、简介 无感配网是指在设备联网过程中无需输入热点相关账号信息,即可快速实现设备配网,是一种兼顾高效性、可靠性和安全性的配网方式。 2、配网原理 2.1 通信原理 手机和智能设备之间的信息传递,利用特有的NAN协议实现。利用手机和智能设备之间的WiFi 感知订阅、发布能力,实现了数字管家应用和设备之间的发现。在完成设备间的认证和响应后,即可发送相关配网数据。同时还支持与常规Sof

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

K8S(Kubernetes)开源的容器编排平台安装步骤详解

K8S(Kubernetes)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。以下是K8S容器编排平台的安装步骤、使用方式及特点的概述: 安装步骤: 安装Docker:K8S需要基于Docker来运行容器化应用程序。首先要在所有节点上安装Docker引擎。 安装Kubernetes Master:在集群中选择一台主机作为Master节点,安装K8S的控制平面组件,如AP

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快