双输入注意的RefineNet在糖尿病视网膜病变多病变分割中的应用

2023-10-24 04:10

本文主要是介绍双输入注意的RefineNet在糖尿病视网膜病变多病变分割中的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Multiple lesion segmentation(多病变分割) in diabetic retinopathy(糖尿病性视网膜病变) with dual-input(双输入) attentive(注意力RefineNet

目录

一、摘要

二、引言

2.1 DARNet的内部结构和整体流程

2.2 主要贡献

三、方法实现

3.1 全局图像编码器和patch图像编码器

3.2 注意力细化解码器(ARM)

(1) 残差卷积单元(RCU)

(2) 注意力融合模块(AFB)

(3) 链式残差合并(CRP)

五、损失函数

六、实验

6.1 与最先进方法的对比实验

(1) IDRiD性能

(2) 在E-Ophtha上的表现

6.2 消融研究

七、结论


一、摘要

研究问题针对糖尿病视网膜病变结构复杂、大小不一、类间相似性大等问题,提出了一种双输入注意力RefineNet,即DARNet,用于糖尿病视网膜病变的多病变自动分割。

网络结构DARNet包括全局图像编码器局部图像编码器注意力细化解码器(ARM)(主要模块)。整个图像和patch图像被用作双输入,并分别馈送到ResNet 50和ResNet 101进行下采样(基线网络)。高级注意力细化解码器采用双重注意力机制,将两个编码器中的同级别特征与低级注意力细化模块的输出进行多尺度特征融合,将模型聚焦在病变区域以生成准确的预测(注意力模块)。

研究成果:在三个数据集上评估了四个病变的分割性能,所提出的方法在IDRiD,E-ophtha和DDR上达到了0.9582/0.9617/0.9578的平均准确率和0.9521/0.9637/0.9508的dice分数。大量的实验结果表明,所提出的DARNet优于当前的最先进的模型,具有更好的鲁棒性和准确性。该方法不仅保留了多尺度病变的轮廓细节和形状特征,而且克服了相似组织和噪声的干扰,实现了多尺度病变的精确分割。

二、引言

2.1 DARNet的内部结构和整体流程

为了解决复杂的结构,各种尺寸和不同种类的病变之间的相似性的问题,本文提出了一种双输入注意精炼网(DARNet)的多病变分割。

网络结构:DARNet采用双输入编解码器结构,该模型包括整体图像编码器、分块图像编码器和注意力细化解码器。

输入输出:输入为整幅图像和patch图像,输出为四个病灶的分割结果。

整体流程:首先,将整个图像和patch图像分别发送到ResNet50和ResNet101,进行下采样以提取特征。其次,ResNet50和ResNet101中第四个残差块的深度特征同时被馈送到底层注意力细化模块(ARM)以融合全局和局部特征。第三,来自两个编码器中的相同级别的特征图和前一个ARM的输出被馈送到当前ARM,以融合多尺度病变特征。最后,将顶层ARM的融合特征图发送到密集sigmoid层(二分类)以获得最终的病变分割结果

2.2 主要贡献

1) 为了充分利用眼底图像的全局粗信息和局部细特征,将全图像和斑块作为双输入,提出了一种双输入注意力细化网络(DARNet)实现DR的多病灶分割。

2) 本文提出了一个注意力细化模块(ARM),以充分整合不同病变的多级上下文特征。它由残差卷积单元(RCU)、注意力融合块(AFB)和链式残差池(CRP)组成。ARM使用细粒度的局部特征作为辅助信息来促进粗粒度全局信息的重组,从而将网络集中在病变区域。

3) 在IDRiD、E-Ophtha和DDR三个眼底图像数据集上进行了综合实验。1. 消融研究表明,整体图像和斑块图像作为双输入和注意力融合块有助于提高病变分割的性能。2. 对比实验表明,该框架优于当前最先进的方法,并具有更好的鲁棒性和准确性。3. 该方法能有效地避免其他相似组织的干扰和噪声的干扰,实现视网膜图像多尺度病变的自动准确分割。

  

三、方法实现

由于眼底图像中病变的不同类型,每个原始图像对应于最多四个标签。

裁剪patch:入分割网络之前,我们将每个训练图像病变mask (x_i,y_i) 裁剪成n个块p = \{ (x_k,y_i) , k = 1,...,n \}。训练目标函数为: 

其中,X = \{x_i,i = 1,...,m\}表示原始眼底图像,Y = \{y_i,i = 1,...,m,y_i \in (0,1)\}表示病变标记,m表示训练集中的图像的数量。

DARNet的整体架构如下图所示:

架构概述:该模型采用编码器(下采),解码器(上采)结构,由全局图像编码器、patch图像编码器注意力细化解码器(ARM)组成。

   

3.1 全局图像编码器和patch图像编码器

目的:ResNet通过跳跃连接引入残差块来改善信息流(避免退化问题),并由多个浅层网络组成以加快网络收敛

方法:两个编码器分别将整个图像和patch(裁剪块)发送到ResNet50和ResNet101,进行下采样以获得不同分辨率的特征图。

结构:ResNet 50和ResNet 101都是由四个残差块组成,每个残差块后输出图像的分辨率都降低到原始图像的1/4。

残差块构成:每个残差块包括三个卷积层、两个批归一化(BN)层和三个修正线性单元(ReLU)层的卷积层。

全局图像编码路径和patch图像编码路径可以定义为:

  

3.2 注意力细化解码器(ARM)

ARM模块由残差卷积单元(RCU)、注意力融合模块(AFB)链式残差池(CRP)组成。

目的

1. RCU模块用于提取多尺度特征

2. AFB模块利用局部特征作为辅助信息,促进全局信息的重组,使模型聚焦于(定位)病变区域。

3. CRP用于捕获较大图像区域中的上下文特征

以这种方式,(多尺度)融合细粒度局部信息和粗全局信息有利于生成准确的病变分割结果。

输入:ResNet50和ResNet101中的同一层级的残差块的深度特征,除了ARM1以外的ARM模块还需要输入前一次ARM的输出特征

过程:首先,将整幅图像特征、patch图像特征和前一次ARM模块的输出特征分别输入到三个RCU模块中提取多尺度特征。其次,三个RCU模块输出的特征图被集成到AFB模块中以定位病变区域。第三,将融合的注意力特征馈送到CRP模块以捕获较大图像区域中的上下文特征。最后,池化操作的输出被馈送到RCU以获得最终预测。相关定义如下:

其中, x_ix^k_i 表示第 j 个ARM的输入的全图像和patch图像特征, S_{j-1}表示前一个ARM的输出特征,M_{fusion}M^c _{fusion}M^s _{fusion} 分别表示三个输入的融合特征信道注意力特征空间注意力特征W_{attention}S_j 分别表示ARM的注意力权重第 j 个ARM模块的输出

  

(1) 残差卷积单元(RCU)

RCU模块的详细结构,如图所示:

它包括两个ReLU和两个卷积层,内核大小为3 × 3。此外,它使用加法来融合卷积前后的特征图。

  

(2) 注意力融合模块(AFB)

这是一个双重注意机制。

目的:增强特定的语义信息以改善通道之间的依赖性,而且可以在空间上捕获丰富的上下文特征表示。

结构:这是一个双重注意机制,由通道注意模块空间注意模块组成,通道注意和空间注意都是由一个单独的多头自注意力模块捕获。

1. 通道注意力模块

输入:将来自ARM中的三种类型的输入的融合特征定义为

                                                                                               M_{fusion} \in R^{W\times H \times C}

其中,W、H和C分别表示特征图的宽度、高度和通道数。

过程:首先,将融合特征分别整形为 M^{c1}_{fusion} \in R^{C\times (W\times H)}M^{c2}_{fusion} \in R^{C\times (W\times H)}M^{c3}_{fusion} \in R^{C\times (W\times H)}。然后,M^{c1}_{fusion}M^{c2}_{fusion}利用矩阵乘法和softmax运算得到通道注意力图 t^c \in R^{C\times C} 。然后,t^cM^{c3}_{fusion}再通过矩阵乘法和一个整形操作,将特征图恢复到原大小。最后,再与原特征M_{fusion}通过各元素相加操作得到最终的通道注意特征。定义如下:

                                                                                M^c_{fusion} = M_{fusion} + Reshape(t^cM^{c3}_{fusion})

Q:通道注意力图t^c \in R^{C\times C}的作用?

A:我们来看一个稍微传统的捕获通道注意力的多头注意力模块结构,可以明显看到融合通道注意力的第一步是压缩空间得到一个通道特征向量:

而本文中通道注意力图t^c \in R^{C\times C} 的操作示意图如下所示(它最终得到的是一个att 图而不是单个向量):

t^c \in R^{C\times C}相当于多个通道注意力向量,虽然它不像传统的单个通道特征向量特征那么集中,但是也能起到通道注意力的效果。(这里可以做个对比试验,效果不一定)

 

2. 空间注意力模块(改进了传统的空间注意力模块,降低计算复杂度!!!

过程:在融合特征图上执行三个卷积运算以获得三个分支。首先,将来自前两个分支的特征图的通道维度降低到 C/f 以降低计算复杂度。其次,将整形后的特征 M^{s1}_{fusion} \in R^{(W\times H)\times C/f}M^{s2}_{fusion} \in R^{C/f\times (W\times H)} 相乘。第三,使用softmax函数来获得空间注意力图。最后,通过(这里与通道注意力模块相似)计算空间注意特征

细节:实验中设置 f 为 8、16、32和64,以适应以下不同尺度的特征图28 × 28 × 2048、56×56×1024、128×128×512和256 ×256×256。


ARM(总)的最终输出:是 M^c_{fusion}M^s_{fusion} 以及前一个ARM的输出 S_{j-1} 的逐像素加权相加。

  

(3) 链式残差合并(CRP)

CRP的具体结构如图所示,它是由多个池化操作组成的链,类似于RefineNet的CRP。每个池化模块包含卷积层和最大池化层。下一个CRP将前一个CRP的输出作为输入,因此当前CRP可以重用前一个池化操作的结果。因此,在不使用较大池化窗口的情况下从较大背景区域捕获上下文特征

五、损失函数

由于视网膜图像中的病变像素和正常像素之间的严重不平衡,如果不考虑样本不平衡问题,预测往往更倾向于健康像素。因此,我们使用类平衡的二进制交叉熵损失dice损失的加权和作为建议DARNet的整体损失函数,以解决潜在的过拟合问题。

Y =\{y_i,i = 1,...,m,y_i \in (0,1)\} 表示病变标签,并且 S =\{s_i,i = 1,...,m,s_i \in (0,1)\} 表示网络的预测,则损失函数定义为:

dice损失能够缓解缓解数据集数据不平衡问题。

ACL2020 | 香侬科技提出使用Dice Loss缓解数据集数据不平衡问题

六、实验

数据集:IDRiD、E-Ophtha和DDR三个眼底图像数据集上评估了DARNet 的分割性能。

评估指标:sensitivity (Sen), specificity (Spe), accuracy(Acc) 和 Dice 来评估各种网络的分割性能。此外还采用了接受者操作特征曲线(ROC)可视化病变分割的不同方法的性能。

6.1 与最先进方法的对比实验

(1) IDRiD性能

a,b,c,d分别展示多种不同的对比网络在硬渗出(EX)、软渗出(SE)、微动脉瘤(MA)和出血(HE) 病变图像中的分割效果。

上图所示,使用四种颜色来表示本文所提出网络的分割效果(四种不同的病变)。红色表示 EX,黄色表示 SE,蓝色表示MA,绿色表示HE。

分析:在 IDRiD数据集上定量比较了我们的方法和其他 7 种最先进的方法的 4 个病灶分割性能。由表可知,提出的方法在分割 EX、SE、MA和HE时,Acc和Dice分别达到了 0.9823/0.9752/0.9217/0.9537 和 0.9782/0.9642/0.9183/0.9478,在 IDRiD 数据集上的实验结果
证明了DARNet 在多病灶分割方面的优越性。

  

(2) 在E-Ophtha上的表现

a,b分别展示多种不同的对比网络在硬渗出(EX)、微动脉瘤(MA) 病变图像中的分割效果。

上图显示了不同网络在分割EX和MA中的ROC曲线,以评估实验性能。据观察,所提出的DARNet的AUC值高于其他四种方法的EX分割或MA分割的性能。 

分析:从下表中可以看出,提出的方法在大多数标准上超越了其他方法,并且分割EX和MA的Acc和Dice分别达到0.9746/0.9489和0.9761/0.9513。与Guo et al.,EX和MA的Acc和Dice分别增加了20.03%/25.07%和26.02%/29.66%。上述结果表明,所提出的模型的优越性,超过了现有的最先进的方法。

6.2 消融研究

双输入消融实验和注意融合模块消融实验,如下表所示:

分析:1. 与单输入框架相比,双输入网络的分割性能优于单输入网络。具体而言,与基线模型 1 和模型 2 相比,DARNet 的 Acc 和 Dice 分别增加了 1.96%/1.21%/0.54%和 2.58%/1.31%/0.4%。2. 使用注意细化模块(ARM)时,正确率和 Dice 分数分别提高了 0.93%和 0.97%。这说明 ARM能够充分整合多层上下文特征,使网络更加关注病变区域。

七、结论

1. 这是一个双输入网络,通过patch输入来提高细小病变特征的分辨率。

2. 注意力融合模块(AFB)是一个通道注意 + 空间注意模块,通道注意模块通过获取一个通道注意力图,再进行特征融合,空间注意模块进行了计算量的压缩。

3. 本文采用了残差网络作为主干网络,保证了训练过程中不会出现退化问题。

这篇关于双输入注意的RefineNet在糖尿病视网膜病变多病变分割中的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/272602

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。