【论文笔记】RA-UNet: A Hybrid DeepAttention-Aware Network to ExtractLiver and Tumor in CT Scans

本文主要是介绍【论文笔记】RA-UNet: A Hybrid DeepAttention-Aware Network to ExtractLiver and Tumor in CT Scans,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

RA-UNet:用于在CT扫描中提取肝脏和肿瘤的一种混合深度注意力感知网络

论文地址:https://arxiv.org/abs/1811.01328
代码地址:https://github.com/RanSuLab/RAUNet-tumor-segmentation

目录

文章结构

问题动机

贡献

创新点

方法

网络总体结构

数据的预处理

RA-UNet 的结构

以U-Net作为基本结构

残差学习机制

注意力残差学习机制

损失函数

阶段一:使用 RA-UNet-I 进行肝脏定位

阶段二:使用 RA-UNet-II 进行肝脏分割

阶段三:基于RA-UNet-II的肿瘤提取

优化器

总结

文章结构

  1. 问题的背景与文章的贡献。

  2. 简要回顾了最新的自动化肝肿瘤分割方法。

  3. 详细介绍了这些方法,包括数据集、预处理策略、混合深度学习结构和训练过程。

  4. 对提出的方法进行了评估,报告了实验结果,并与其他一些方法进行了比较,并将方法扩展到了其他医学分割任务中。

  5. 给出了结论和下一步的工作。

问题动机

由于肝脏和肿瘤的异质和扩散形状,从CT图像中分割它们是具有挑战性的。

通常肝脏和肿瘤提取方法可以分为三类:手动分割、半自动分割和自动分割。手动分割是一种主观性强、可重复性差且耗时的方法。它在很大程度上依赖于人手工提取的可识别特征,并且需要具有高水平技术技能的人员来完成。半自动分割需要初始的人工干预,这可能导致偏差和错误。

为了加速和促进诊断、治疗计划和监测,并最终帮助外科医生切除肿瘤,有必要开发一种自动和精确的方法来从CT图像中分割肿瘤。

困难:大规模的空间和结构变化、肝脏与肿瘤区域之间的对比度低、噪声、部分体积效应、3D空间肿瘤特征的复杂性、附近器官之间的相似性。3D网络通常不像相应的2D网络那样有效和灵活,3D卷积的高计算成本和低效率,这使得2D网络扩展到3D网络是不切实际的。

为了解决这些问题,文章提出了一种混合残差注意力感知的肝脏和肿瘤提取神经网络RA-UNet,旨在以端到端的方式有效地从CT图像中提取肝脏和肿瘤的3D体积上下文特征。所提出的网络集成了残差U-Net架构和注意力残差学习机制,使得能够在深度网络上进行优化和性能改进。

贡献

  1. 通过堆叠注意力模块可以实现不同类型的注意力,从而使注意力感知特征可以自适应地变化。

  2. 使用 3D U-Net 作为基本架构来捕获多尺度注意力信息,并将低级特征与高级特征相结合。

  3. RA-UNET可以直接从3D数据中分割肝脏和肿瘤。

  4. 模型不依赖于任何预先训练的模型或常用的后处理技术。

创新点

  1. 大多数最新的CNN架构,都使用来自3D图像的2D切片来执行分割任务。没有考虑器官的空间结构组织,没有充分利用体积信息。RA-UNet直接使用3D图像进行分割。

  2. 首次在医学影响分割任务中实现注意力残差机制

方法

网络总体结构

包括三个主要阶段,依次提取肝脏和肿瘤。

  1. 为了减少整体计算时间,使用名为RA-UNET-I的2D剩余注意力感知U-Net(RA-UNET-I)来获得粗略的肝脏边界框。 

  2. 对3D RA-UNET进行训练,以获得精确的感兴趣区域(volume of interest , VOI)。

  3. 将得到的肝脏VOI送到第二个RA-UNET-II来提取肿瘤区域。

数据的预处理

HU值设置为-100~200,对加窗后的数据进行了零均值归一化和最小最大归一化。

RA-UNet 的结构

以U-Net作为基本结构

包含编码器和解码器两部分。编码器提取不同层次的特征,解码器接收具有不同复杂性的特征,并以从粗到细的方式重建特征。通过编码器部分和相应的译码部分引入了远程连接,使得编码器的不同层次特征可以合并到译码部分,从而使网络更加精确和可扩展。

残差学习机制

在反向传播中,残差网络的梯度是累加,避免了梯度消失的问题。

每个残差块由批归一化(BN)层、激活(RELU)层和卷积层组合而成。除了第一和最后一层(图2D)之外,其余的块被堆叠起来,以释放深度神经网络的能力。

残差单元可以直接将特征从早期卷积传播到晚期卷积,从而提高模型的性能。

注意力残差学习机制

注意力残差机制将注意力模块分为主干分支和软掩码分支,主干分支用于处理原始特征,软掩码分支用于构造恒等映射。

软掩码分支中的编码器包含最大池操作、残差块和连接到相应解码器的远程残差块,其中在残差块和上采样操作之后执行逐元素求和。在软掩码的编码器和解码器部分之后,添加了两个卷积层和一个 Sigmoid 层以对输出进行归一化。

在注意力残留机制中,它旨在增强良好的特征并减少来自主干分支的噪声。

一般来说,注意力残差机制可以通过主干分支保留原始特征信息,通过软掩模分支关注那些肝肿瘤特征。

损失函数

采用Dice损失函数。

阶段一:使用 RA-UNet-I 进行肝脏定位

目的:降低通过 RA-UNet-II 精确分割肝脏和肿瘤的计算成本。

将切片下采样到256 * 256,使用2D版本的RA-UNet初步分割得到每个切片上的肝脏边界框,再使用3D连通域标记方法标记,取最大的区域,并在xyz轴方向上扩展了 10 个像素(为确保包括整个肝脏区域),获得肝脏的3D边界框,最后将图像插值到512 * 512。

RA-UNet-I网络结构:

阶段二:使用 RA-UNet-II 进行肝脏分割

将 x-y 平面中的肝脏边界框插值到 224×224,并在 z 方向连续随机选取 32 个切片以形成训练补图像块。在每个 CT 块上使用 RA-UNet-II 以按顺序生成 3D 肝脏概率块。然后,我们对这些概率块进行插值和堆叠,以恢复到边界框的原始大小。

RA-UNet-II网络结构:

阶段三:基于RA-UNet-II的肿瘤提取

未进行插值和大小调整,以免丢失小病灶。为了确定patch size,将patch size分别设置为32×32×32、64×64×32和128×128×32来测试肿瘤分割的性能。结果表明,128×128×32 块大小的数据实现了最佳的肿瘤分割性能。在肿瘤以及周围的非肿瘤区域都选取图像块进行训练,以解决数据不平衡问题并学习更有效的肿瘤特征。在合并的 VOI 上使用投票策略以产生最终的肿瘤分割。最后,过滤掉不在肝脏区域的体素。

优化器

使用Adam优化器,初始LR为 0.001,β1=0.9,β2=0.999。

总结

文章提出一种名为RA-UNet的3D混合残差注意感知的分割方法,以精确提取感兴趣的肝脏体积(VOI)并从肝脏VOI中分割肿瘤。RA-UNet以3-Unet作为基本体系结构,然后结合不同层次的特征图提取上下文信息。利用残差和注意力相结合的分割网络-RA-UNet,包括三个阶段:使用RA-UNet-I 进行肝脏定位、使用RA-UNet-II进行肝脏的精确分割和 使用RA-UNet-II 分割肿瘤部分。堆叠注意力模块解决了梯度消失的问题,使得网络能够变得更深,通过残差学习使得注意力特征图自适应变化。得到的分割模型泛化能力较强,在另一个肿瘤分割数据集中也有很好的表现。

这篇关于【论文笔记】RA-UNet: A Hybrid DeepAttention-Aware Network to ExtractLiver and Tumor in CT Scans的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/401715

相关文章

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓