文献学习-24-用于少发罕见病诊断的动态特征拼接

2024-04-02 00:20

本文主要是介绍文献学习-24-用于少发罕见病诊断的动态特征拼接,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Dynamic feature splicing for few-shot rare disease diagnosis

Authors: Yuanyuan Chen, Xiaoqing Guo , Yongsheng Pan , Yong Xia , Yixuan Yuan
Source: Medical Image Analysis 90 (2023) 102959 
Keywords:  少样本学习 罕见病诊断 transformer 特征拼接 通道相似度

Abstract

用于罕见病诊断的注释图像极难收集。因此,在少数样本学习 (FSL) 设置下识别罕见疾病具有重要意义。现有的FSL方法从具有丰富训练样本的基类中转移有用的全局知识,以丰富训练样本较少的新类的特征,但由于病变特征复杂且类内方差大,在应用于医学图像时仍面临困难。在本文中,提出了一种用于罕见病诊断的动态特征拼接(DNFS)框架。在DNFS下,新类的低级特征(即三个卷积块的输出)和高级特征(即最后一个全连接层的输出)都得到了动态的丰富。构建了位置相干DNFS(P-DNFS)模块来执行低级特征拼接,其中设计了一个面向病变的变压器来检测病变区域。因此,在检测到的病变区域内,新颖的类通道被相似的碱基类通道所取代,以实现与疾病相关的特征富集。还设计了一个语义连贯的DNFS(S-DNFS)模块来执行高级特征拼接。它探索跨图像通道关系,并选择具有语义一致性的基类通道进行显式知识转移。低级和高级特征拼接都是动态和迭代执行的。因此,为疾病诊断生成了丰富的拼接特征,从而实现了更准确的决策边界和更高的诊断性能。已经对三个医学图像分类数据集进行了广泛的实验。结果表明,所提出的DNFS与最先进的方法相比具有优越的性能。

图 1.提出的 DNFS 框架的图示。(a)和(b)说明了每对碱基类和新类之间的全局类相似性和通道相似性;(c) 基于微调的FSL方法导致有偏见的决策边界;(d) 拟议的DNFS丰富了新型特征的分布,从而得出了更准确的决策边界;(e) 类内差异较大的例子。

本文提出了一种新型动态特征拼接(DNFS)框架,以明确利用常见疾病(即具有丰富训练样本的基类)的丰富知识来辅助罕见疾病(即训练样本较少的新类)的诊断。特征拼接是指将特定的小级特征替换为相似的基类特征的过程。考虑到特征通道可以精致地描绘基础类知识,因此在特征通道级别进行拼接。此外,由于低级特征(即三个卷积块的输出)包含有关疾病相关特征的丰富信息,而高级特征(即最后一个全连接层的输出)捕获有关语义特征的抽象信息,因此分别为低级特征和高级特征定义了不同的特征拼接操作。具体而言,由于病灶区域包含丰富的疾病相关信息,设计了一种位置相干 DNFS (P-DNFS) 模块,用于病灶区域内的低级特征剪接。在该模块中,构建了一个面向病灶的Transformer,通过捕获不同图像分量之间的关系来检测病灶区域。

同时,设计了一个用于高级特征拼接的语义相干DNFS(S-DNFS)模块。它着重于探索跨图像通道的语义关系,并利用同一类中的图像来计算通道的语义相似性。因此,它可以在高级特征拼接过程中保持高级语义一致性。通过动态迭代地将新奇类通道替换为相似的碱基类通道,可以生成大量用于疾病诊断的合成新奇类样本。新类别的特征分布被动态丰富和补充,从而能够进行充分的模型训练,并为罕见病诊断推导出准确的决策边界(见图1(d))。

主要贡献总结如下。

• 这项研究是首次尝试通过在功能频道级别将有价值的知识从基础类转移到小类来应对 FSL 挑战。

• 提出了用于低级特征拼接的 P-DNFS 模块。P-DNFS 模块包含一个面向病灶的 Transformer,可识别图像中的病灶区域,从而实现与疾病相关的新型特征的多样化。

• 介绍了用于拼接高级功能的 S-DNFS 模块。S-DNFS模块探索了图像之间的像素关系,并在保持语义一致性的同时,从高级语义方面丰富了特征。

• 在三个公共医学图像分类数据集上的大量实验结果表明,所提出的DNFS框架比几种最先进的解决方案具有更优越的性能。

图 2.所提出的动态特征拼接(DNFS)框架的架构。有两个核心模块:(1)用于富级特征拼接的位置相干DNFS(P-DNFS)模块和(2)用于抽象级特征拼接的语义相干DNFS(S-DNFS)模块。上部基础分支使用大量基类样本进行预训练。下部分支根据类训练样本的原始和拼接特征进行了微调。建议的病变导向变压器和通道置换操作的详细信息显示在图的底部。

所提出的DNFS框架由一个基础分支、一个新分支、一个P-DNFS模块和一个S-DNFS模块组成(见图2)。基础分支和新分支具有相同的特征提取器架构。使用所有基类样本来预训练基分支。然后使用预训练的基础分支来初始化新分支,并使用新类的训练样本对后者进行微调。PDNFS模块和S-DNFS模块从两个分支获取中间特征后,分别进行低级特征拼接和高级特征拼接。将新样本的拼接特征直接反馈进行诊断,损失向后传播以更新新分支和两个模块。

由于诊断相关的鉴别信息大多包含在病灶区域,而不是正常区域,因此应检测病灶区域进行低级特征拼接。然而,由于医学图像中的病灶位置多样化,两个特征图中的病灶区域可能不在同一位置。因此提出了用于低级特征拼接的P-DNFS模块,其中设计了一个面向病灶的Transformer,以获取每个特征图中的病灶区域,然后在检测到的病灶区域内进行通道置换,以丰富与疾病相关的特征。

由于特征向量包含丰富的高级语义信息,直接主导诊断结果,因此保持语义一致性成为高级特征拼接的关键问题。为了更好地描述每个通道的语义信息,应同时使用同一类中的多个图像。因此,提出了用于高级特征拼接的S-DNFS模块,从全局视角着重探索图像之间的通道语义关系。然后,在基本类和新类的相似通道之间进行语义连贯通道替换,以实现显式知识转移。语义连贯相似性估计。给定一对图像 xb 和 xn,分别使用它们的拼接特征图获得两个特征向量 fb 和 fn。为了探索多个图像的通道语义,计算了相同基类和新颖类中每个图像的 fb 和 fn,然后将它们聚合以获得 gb 和 gn 。为了选择相似的通道进行替换,测量了 gb 和 gn 之间的通道相似度 sim′ c。与特征图的测量类似,假设 gb 和 gn 的信道分布为高斯分布,并分别计算每个通道的 D′ b = N(μ ′ b , σ′ b 2 ) 和 D′ n = N(μ ′ n , σ′ n 2 ) 。然后,计算它们的分布相似性,并确定要转移的最佳匹配知识。对所有通道进行替换后,获得每个新类别的拼接特征组sn,并将其送入新分支分类器进行疾病诊断。

总结算法1中提出的动态特征拼接(DNFS)框架。对于低级特征剪接,P-DNFS模块遵循“图像→病变→通道”剪接结构,以动态丰富新类别的疾病相关特征(算法1:3-5)。对于高级特征拼接,S-DNFS 模块遵循“类→图像→通道”拼接结构,以语义一致性使高级新颖类特征多样化(算法 1:6-8)。两个模块都提供了金字塔形拼接结构,以充分探索基类的丰富级病变知识和抽象级语义知识。这些知识可以在互补方面帮助新颖级特征的丰富,从而产生更准确的决策边界和更高的诊断性能。在训练阶段,通过最小化交叉熵损失,以端到端的方式训练新分支和两个模块,同时固定预训练基础分支的参数。在推理过程中,将新颖类特征图发送到面向病灶的 Transformer Tn 以突出显示病灶区域,然后将增强的新颖类特征反馈用于疾病诊断。请注意,P-DNFS 和 S-DNFS 仅用于训练以获得更好的特征,并且没有用于推理的特征拼接。

表1 各数据集的详细分类和对应图像编号

图 3.讨论 ISIC 数据集 ((a),(b))、NIH 胸部 X 射线数据集 ((c),(d)) 和 Kvasir 数据集 ((e),(f)) 上的超参数 K1 和 K2。AUC 和 ACC 值是 20 次运行的平均值。

检测病灶区域的必要性

在所提出的面向病灶的 Transformer 中,获得每个图像的病灶显著性,以突出病灶中心和病灶边缘的位置。在低级特征拼接之前,基于病灶显著性检测病灶有两个方面是必要的。首先,由于病变和正常区域的特征分布差异很大,因此使用整个通道的全局统计来计算通道相似度是不准确的。而且,直接置换整个通道,难免会造成病灶位置脱位,从而可能干扰诊断。在表 6 中的三个数据集上报告了拟议的 DNFS 的结果,无论是否具有病变显著性。可以看出,在三个数据集上,具有病灶显著性的通道替换明显优于直接替换整个通道(无病灶显著性)。这表明检测病变是必要的,并且低水平的特征拼接与检测到的病变区域更准确。

具有不同骨架的 DNFS 的有效性 在实验中,使用 WideResNet28作为基础和新分支的骨干。为了验证所提出的DNFS框架在不同特征提取器上的鲁棒性,在不同的骨干架构上进一步扩展了DNFS,包括传统的四层卷积网络,ResNet18,EfficientNet-B0和WideResNet28。在表7中报告了ISIC数据集上具有不同骨干的基线模型和拟议的DNFS的结果。可以看出,DNFS 为所有主干网带来了很大的性能提升,这表明 DNFS 对不同的特征提取器结构具有鲁棒性。此外,使用WideResNet28作为DNFS的骨干网时,性能最佳,主要得益于更宽网络结构的强大特征表示能力。

图 4.一对基类和新类样本的注意力图的可视化。从上到下,每行分别显示 (a) 三个数据集的输入图像、(b) 突出显示的病变中心、(c) 突出显示的病变边缘和 (d) 正常区域。

图 5.嵌入可视化。最上面一行显示了在执行特征拼接之前,新颖类训练 (a) 和测试 (b) 样本的分布情况。最下面一行显示了进行特征拼接后新颖类训练 (c) 和测试样本 (d) 的分布情况。每种颜色的含义显示在图表的底部。

Reference

Chen, Y., Guo, X., Pan, Y., Xia, Y., & Yuan, Y. (2023). Dynamic feature splicing for few-shot rare disease diagnosis. Medical Image Analysis, 90, 102959.

这篇关于文献学习-24-用于少发罕见病诊断的动态特征拼接的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/868508

相关文章

VUE动态绑定class类的三种常用方式及适用场景详解

《VUE动态绑定class类的三种常用方式及适用场景详解》文章介绍了在实际开发中动态绑定class的三种常见情况及其解决方案,包括根据不同的返回值渲染不同的class样式、给模块添加基础样式以及根据设... 目录前言1.动态选择class样式(对象添加:情景一)2.动态添加一个class样式(字符串添加:情

SpringCloud配置动态更新原理解析

《SpringCloud配置动态更新原理解析》在微服务架构的浩瀚星海中,服务配置的动态更新如同魔法一般,能够让应用在不重启的情况下,实时响应配置的变更,SpringCloud作为微服务架构中的佼佼者,... 目录一、SpringBoot、Cloud配置的读取二、SpringCloud配置动态刷新三、更新@R

如何用Python绘制简易动态圣诞树

《如何用Python绘制简易动态圣诞树》这篇文章主要给大家介绍了关于如何用Python绘制简易动态圣诞树,文中讲解了如何通过编写代码来实现特定的效果,包括代码的编写技巧和效果的展示,需要的朋友可以参考... 目录代码:效果:总结 代码:import randomimport timefrom math

Java中JSON字符串反序列化(动态泛型)

《Java中JSON字符串反序列化(动态泛型)》文章讨论了在定时任务中使用反射调用目标对象时处理动态参数的问题,通过将方法参数存储为JSON字符串并进行反序列化,可以实现动态调用,然而,这种方式容易导... 需求:定时任务扫描,反射调用目标对象,但是,方法的传参不是固定的。方案一:将方法参数存成jsON字

.NET利用C#字节流动态操作Excel文件

《.NET利用C#字节流动态操作Excel文件》在.NET开发中,通过字节流动态操作Excel文件提供了一种高效且灵活的方式处理数据,本文将演示如何在.NET平台使用C#通过字节流创建,读取,编辑及保... 目录用C#创建并保存Excel工作簿为字节流用C#通过字节流直接读取Excel文件数据用C#通过字节

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作