参数仅有0.049M!基于Mamba的医学图像分割新SOTA来了!

2024-04-10 01:52

本文主要是介绍参数仅有0.049M!基于Mamba的医学图像分割新SOTA来了!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目前,基于CNN和Transformer的医学图像分割面临着许多挑战。比如CNN在长距离建模能力上存在不足,而Transformer则受到其二次计算复杂度的制约。

相比之下,Mamba的设计允许模型在保持线性计算复杂度的同时,仍然能够捕捉到长距离的依赖关系。因此基于Mamba的医学图像分割能够结合CNN的局部特征提取能力和Transformer的全局上下文理解能力,更有效地处理医学图像中复杂的结构和模式。

以上海交大提出的VM-UNet为例:

作为首个将Mamba结构融入UNet的模型,VM-UNet引入了视觉态空间(VSS)块作为基础块以捕捉广泛的上下文信息,并构建了一个非对称的编码器-解码器结构。在ISIC17、ISIC18和Synapse数据集上超越UNet++/UNet v2等SOTA。

受此启发,研究者们提出了更多Mamaba医学图像分割改进方案,我整理了其中10个值得学习的最新成果分享,论文以及开源代码也列上了,方便同学们复现。

论文原文以及开源代码需要的同学看文末

UltraLight VM-UNet

UltraLight VM-UNet: Parallel Vision Mamba Significantly Reduces Parameters for Skin Lesion Segmentation

方法:论文提出了一种用于处理深层特征的并行Vision Mamba层(PVM层)。PVM层使用四个并行的VSS块来处理特征,每个VSS块处理的通道数是初始通道数的四分之一。由于Mamba中输入通道数对参数数量有爆炸性影响,处理四分之一通道数的VSS块参数只是原始VSS块参数的6.9%,减少了93.1%。

基于PVM层,作者提出了参数仅为0.049M,GFLOPs仅为0.060的UltraLight Vision Mamba UNet。UltraLight VM-UNet的参数比传统的纯Vision Mamba UNet模型(VM-UNet)低99.82%,比可用的最轻量级Vision Mamba UNet模型(LightM-UNet)低87.84%

创新点:

  • 提出了一种用于处理深度特征的并行视觉曼巴方法,名为PVM Layer,它在保持总体处理通道数不变的同时,以最低的计算负载实现了出色的性能。

  • 对曼巴参数影响的关键因素进行了深入分析,并基于此提出了用于处理深度特征的并行视觉曼巴层(PVM Layer)。

VM-UnetV2

VM-UNET-V2: Rethinking Vision Mamba UNetfor Medical Image Segmentation

方法:论文提出了VM-UnetV2算法,是对医学图像分割中基于SSM的算法的改进探索。作者在七个数据集上进行了详尽的实验,结果表明VM-UNetV2具有显著的竞争力。作者是首次将基于SSM的算法与Unet变种相结合的探索者,推动了更高效、更有效的基于SSM的分割算法的发展。

创新点:

  • 作者提出了VM-UnetV2,首次在医学图像分割中探索了更好的基于SSM的算法。

  • 在七个数据集上进行了全面的实验,结果表明VM-UNetV2展现出显著的竞争力。

  • 作者首次探索了将基于SSM的算法与Unet变体相结合,推动了更高效、更有效的基于SSM的分割算法的发展。

LMa-UNet

Large Window-based Mamba UNet for Medical Image Segmentation: Beyond Convolution and Self-attention

方法:论文引入了一种基于Mamba的UNet模型用于医学图像分割,实现了大窗口空间建模。此外,作者设计了一种分层和双向的SSM,进一步增强了Mamba在局部和全局特征建模方面的能力。

创新点:

  • 提出了基于大窗口的Mamba U-Net(LMa-UNet)用于二维和三维医学图像分割。相比于基于小核的CNN和基于小窗口的Transformer,LMa-UNet利用大窗口在局部空间建模方面具有优势,在全局建模方面保持了超过二次复杂度的自注意力的高效性能。

  • 设计了一种新颖的分层和双向的Mamba模块,进一步增强了Mamba在全局和局部空间建模能力。通过引入双向扫描,模型能够更好地关注图像中具有更多器官和病变的中心区域,并能够很好地对每个补丁的绝对位置信息和相对位置信息进行建模。

Mamba-UNet

Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation

方法:论文介绍了一种用于医学图像分割的纯视觉Mamba块基于UNet风格的网络,称为Mamba-UNet。研究结果表明,与UNet和Swin-UNet等经典相似网络相比,Mamba-UNet具有更好的性能。作者还计划将Mamba-UNet扩展到3D医学图像,并进行半/弱监督学习,以进一步推动医学成像领域的发展。

创新点:

  • Mamba-UNet:引入了一种纯视觉Mamba块为基础的UNet风格网络,用于医学图像分割。与经典的UNet和Swin-UNet等类似网络相比,Mamba-UNet表现出更出色的性能。

  • Visual Mamba块:在U-Net架构中引入了Visual Mamba块(VSS),以改善医学图像分析中的远距离依赖建模。这种创新提供了一种新的方法来处理长序列数据,并在医学图像分割领域中取得了优越的性能。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“曼巴医学”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

这篇关于参数仅有0.049M!基于Mamba的医学图像分割新SOTA来了!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/889781

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

多路转接之select(fd_set介绍,参数详细介绍),实现非阻塞式网络通信

目录 多路转接之select 引入 介绍 fd_set 函数原型 nfds readfds / writefds / exceptfds readfds  总结  fd_set操作接口  timeout timevalue 结构体 传入值 返回值 代码 注意点 -- 调用函数 select的参数填充  获取新连接 注意点 -- 通信时的调用函数 添加新fd到

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采