Data augmentation using learned transformations for one-shot medical image segmentation-论文详解

本文主要是介绍Data augmentation using learned transformations for one-shot medical image segmentation-论文详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这是一篇CVPR2019的论文,主要是做Magnetic resonance imaging(MRI)医学图像的分割(segmentation)。

MRI

磁共振成像MRI)是一种用于放射学中的医学成像技术,用于形成人体解剖结构和生理过程的图片。MRI扫描仪使用强磁场,磁场梯度和无线电波来生成体内器官的图像。MRI不涉及X射线或使用电离辐射,这与CT或CAT扫描以及PET扫描不同。磁共振成像是一种医学上的应用的核磁共振(NMR)。NMR也可用于其他NMR应用(例如NMR光谱)中的成像

虽然现在在大多数医学环境中都可以很好地控制X射线的危害,但MRI扫描仍可能比CT扫描更好。MRI在医院和诊所中广泛用于医疗诊断,疾病分期和随访,而无需将身体暴露于放射线下。与CT相比,MRI可能会产生不同的信息。风险和不适可能与MRI扫描有关。与CT扫描相比,MRI扫描通常需要更长的时间并且声音更大,并且通常需要对象进入狭窄的封闭管中。此外,体内装有某些医疗植入物或其他不可移动金属的人可能无法安全地进行MRI检查。

MRI最初称为NMRI(核磁共振成像),但为了避免负关联而放弃了“核”。[1]当置于外部磁场中时,某些原子核能够吸收和发射射频能量。在临床和研究MRI中,氢原子最常用于生成可检测到的射频信号,该信号被靠近要检查的解剖结构的天线接收。氢原子在人和其他生物有机体中自然丰富,尤其是在水和脂肪中。由于这个原因,大多数MRI扫描本质上都绘制了体内水和脂肪的位置图。无线电波脉冲激发核自旋能量跃迁和磁场梯度将信号定位在空间中。通过改变脉冲序列的参数,可以基于组织中氢原子的弛豫特性在组织之间产生不同的对比度。

image segmentation

图像分割为一个分区的过程的数字图像分成多个段(集的像素,也被称为图像对象)。分割的目的是将图像的表示简化和/或更改为更有意义且更易于分析的图像。[1] [2]图像分割通常用于在图像中定位对象和边界(线,曲线等)。更准确地说,图像分割是为图像中的每个像素分配标签,以使具有相同标签的像素共享某些特征的过程。

图像分割的结果是一组集体覆盖整个图像的片段,或者是从图像中提取的轮廓集(请参见边缘检测)。区域中的每个像素在某些特征或计算的属性(例如颜色,强度或纹理)方面都相似。相邻区域在相同特征方面存在显着差异。[1] 当应用于医学成像中典型的一叠图像时,图像分割后得到的轮廓可借助诸如Marching cubes之类的插值算法用于创建3D重建。

这篇文章要解决的问题是:由于利用MRI数据进行训练的过程中需要进行手动的标注数据,因此作者希望仅仅利用一个区域标注的数据来生成其他未标注的数据和标签。

 

\large $$ \tau_{s}^{(i)}(x)=x \circ \phi^{(i)}, \quad \phi=g_{\theta_{s}}\left(x, y^{(i)}\right) $$

\large $$ \tau_{a}^{(i)}(x)=x+\psi^{(i)}, \quad \psi^{(i)}=h_{\theta_{\alpha}}\left(x, y^{(i)} \circ \phi^{-1}(i)\right) $$

其中的x 就是带标签的MRI原始数据, y就是未被标注的MRI数据。\large $\phi$ 是Spatial deformation function,主要是进行空间转换, \large $\psi^{(i)}$ 是per-voxel volume 的计算,也就是对区域的灰度计算的函数。

\large $\tau_{s}^{(i)}(x)$ 形式化表述为 :x 经过了Spatial transformation。

 \large $\tau_{a}^{(i)}(x)$形式化表述为:X 经过了appearance transformation。

通俗的理解就是:Spatial transformation 就是对空间的变换, appearance transformation:是对像素灰度的变换。当然这里面的变换都是在三维的。

下面是整个的模型架构图:

最后整个的loss:

\large ${\mathcal{L}_{\alpha}\left(x, y^{(i)}, \phi^{(i)}, \phi^{-1(i)}, \psi^{(i)}, c_{\alpha}\right)}{=\mathcal{L}_{s i m}\left(\left(x+\psi^{(i)}\right) \circ \phi^{(i)}, y^{(i)}\right)+\lambda_{\alpha} \mathcal{L}_{s m o o t h}\left(c_{\alpha}, \psi^{(i)}\right)}$

其中第一项:\large $\mathcal{L}_{\operatorname{sim}}\left(\left(x+\psi^{(i)}\right) \circ \phi^{(i)}, y^{(i)}\right)$ 表示的是x经过变换后和y(未标注的)的相似度的损失。

注意:这里面的spatial transformation 和 appearance transformation 都是x和y共同训练所得到的。因此x 变换肯定接近于y的结构。

第二项:\large $\mathcal{L}_{s m o o t h}\left(c_{\alpha}, \psi\right)=\left(1-c_{\alpha}\right) \nabla \psi$ 其中的\large c_a是带标注的二值图像,一旦图片确定,这个是一个确定值,因此我们需要最小化\large $\nabla \psi$,这个表现为图像在变化的过程之中要保持平滑,避免图像的剧烈变化。

最后生成的就是带标签的MRI 数据。 

                                                                                    \large $$ \hat{y}^{(i, j)}=\tau_{s}^{(i)}\left(\tau_{a}^{(j)}(x)\right) $$

                                                                                    \large $$ \hat{l}_{y}^{(i, j)}=\tau_{s}^{(i)}\left(l_{x}\right) $$

利用这个数据可以进行image segmentation 的训练。

 

Experiment

                                                          

             

 

可以看到,从各种指标中论文的方法都取得了不错的成绩,最后的实际实验中也与ground truth最接近。

论文连接:论文

 

这篇关于Data augmentation using learned transformations for one-shot medical image segmentation-论文详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/911987

相关文章

十四、观察者模式与访问者模式详解

21.观察者模式 21.1.课程目标 1、 掌握观察者模式和访问者模式的应用场景。 2、 掌握观察者模式在具体业务场景中的应用。 3、 了解访问者模式的双分派。 4、 观察者模式和访问者模式的优、缺点。 21.2.内容定位 1、 有 Swing开发经验的人群更容易理解观察者模式。 2、 访问者模式被称为最复杂的设计模式。 21.3.观察者模式 观 察 者 模 式 ( Obser

【操作系统】信号Signal超详解|捕捉函数

🔥博客主页: 我要成为C++领域大神🎥系列专栏:【C++核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ 如何触发信号 信号是Linux下的经典技术,一般操作系统利用信号杀死违规进程,典型进程干预手段,信号除了杀死进程外也可以挂起进程 kill -l 查看系统支持的信号

Jitter Injection详解

一、定义与作用 Jitter Injection,即抖动注入,是一种在通信系统中人为地添加抖动的技术。该技术通过在发送端对数据包进行延迟和抖动调整,以实现对整个通信系统的时延和抖动的控制。其主要作用包括: 改善传输质量:通过调整数据包的时延和抖动,可以有效地降低误码率,提高数据传输的可靠性。均衡网络负载:通过对不同的数据流进行不同程度的抖动注入,可以实现网络资源的合理分配,提高整体传输效率。增

Steam邮件推送内容有哪些?配置教程详解!

Steam邮件推送功能是否安全?如何个性化邮件推送内容? Steam作为全球最大的数字游戏分发平台之一,不仅提供了海量的游戏资源,还通过邮件推送为用户提供最新的游戏信息、促销活动和个性化推荐。AokSend将详细介绍Steam邮件推送的主要内容。 Steam邮件推送:促销优惠 每当平台举办大型促销活动,如夏季促销、冬季促销、黑色星期五等,用户都会收到邮件通知。这些邮件详细列出了打折游戏、

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

常用MQ消息中间件Kafka、ZeroMQ和RabbitMQ对比及RabbitMQ详解

1、概述   在现代的分布式系统和实时数据处理领域,消息中间件扮演着关键的角色,用于解决应用程序之间的通信和数据传递的挑战。在众多的消息中间件解决方案中,Kafka、ZeroMQ和RabbitMQ 是备受关注和广泛应用的代表性系统。它们各自具有独特的特点和优势,适用于不同的应用场景和需求。   Kafka 是一个高性能、可扩展的分布式消息队列系统,被设计用于处理大规模的数据流和实时数据传输。它

Linux中拷贝 cp命令中拷贝所有的写法详解

This text from: http://www.jb51.net/article/101641.htm 一、预备  cp就是拷贝,最简单的使用方式就是: cp oldfile newfile 但这样只能拷贝文件,不能拷贝目录,所以通常用: cp -r old/ new/ 那就会把old目录整个拷贝到new目录下。注意,不是把old目录里面的文件拷贝到new目录,

BD错误集锦3——ERROR: Can't get master address from ZooKeeper; znode data == null

hbase集群没启动,傻子!   启动集群 [s233 s234 s235]启动zk集群 $>zkServer.sh start $>zkServer.sh status   [s233] 启动dfs系统 $>start-dfs.sh 如果s237 namenode启动失败,则 [s237] $>hadoop-daemon.sh start namenode [s233]启动yarn集群

BD错误集锦1——[Hive]ERROR StatusLogger No log4j2 configuration file found. Using default configuration:

错误描述:在使用IDEA进行jdbc方式连接到hive数据仓库时,出现以下错误:                ERROR StatusLogger No log4j2 configuration file found. 问题原因:缺少log4j2.xml文件   <?xml version="1.0" encoding="UTF-8"?><Configuration><Appender

笔记-python之celery使用详解

Celery是一个用于处理异步任务的Python库,它允许你将任务分发到多个worker进行处理。以下是Celery的使用详解: 安装Celery 使用pip安装Celery: pip install celery 创建Celery实例 首先,需要创建一个Celery实例,指定broker(消息中间件)和backend(结果存储)。 from celery import Celeryap