基于变压器的手持式超声图像中乳腺病变的分类不一致性测量表征

本文主要是介绍基于变压器的手持式超声图像中乳腺病变的分类不一致性测量表征,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

超声成像作为一种替代的低成本、易于获取的非电离成像方式已显示出巨大的前景,可用于乳腺癌筛查。特别是,随着最近便携式设备的出现,超声检查预计将在中低收入国家中越来越普及。然而,超声成像在乳腺癌诊断中的可靠性高度依赖于操作超声医师和检查放射科医生的经验。

为了解决这一限制,人们开发了计算机辅助诊断(CAD)工具来标准化超声测试。深度学习技术的进步使得肿瘤检测、分割和分类等任务实现自动化。卷积神经网络(CNN)在区分良性和恶性乳腺病变方面,通过结合从超声图像中提取的放射组学特征进一步提高此类模型的性能。

深度学习方法面临数据缺失、数据分布不平衡、解空间巨大等挑战,加剧了学习过程的不确定性,从而影响了这些学习算法的性能。为了缓解这些问题,至关重要的是以忽略不可靠预测或将其传递给放射科专家的方式来呈现 CAD 模型的不确定性估计 。

本研究的重要目的是:设计一个指标量化乳腺病变分类结果的不确定性;采用所提出的不确定性度量来改进模型的性能特征。


数据集

总共包含 1150 张图像,其中 469 个病变的横向和纵向视图。病变边界注释是参考超声检查专家放置的卡尺进行的。 BIRADS评分由放射科专家进行评分,据此将病变分为良性(N=839,BIRADS=1&2)或恶性(N=311,BIRADS 3+,活检阳性)。

BI-RADS评分系统是将乳腺肿块分为0~6级,随着级别的升高,恶性风险度也逐渐升高。0级是指需要进行进一步检查;1级为阴性;2级为良性;3级是可能性大的良性,需要半年随诊一次超声;4级是可疑恶性,需要进行活检;5级是高度恶性,需要进行手术切除;6级是已经病理证实为恶性。

 基于手动病灶边界注释:

对图像进行裁剪以消除超声成像软件添加的轴和标签,然后使用最近邻插值技术将其大小调整为 120x120 像素。随后,将每个图像的像素强度归一化至零均值和单位标准差,然后分为大小为 10x10 像素的非重叠图像块。


通过随机选择70个良性和 70 个恶性病变图像形成包含 140 个观察值的测试数据集。鉴于用于训练和验证模型的剩余观察数量有限,特别是在恶性病变的情况下(769 个良性图像和 241 个恶性图像),通过随机平移或翻转每个图像来执行数据增强。选择这些变换是因为它们提供了病变的真实替代视图,这可能是由于超声探头的不同定位和方向造成的。

良性和恶性图像分别增加了 2 倍和 7 倍,总共有 3225 个观察值(1538 个良性图像和 1687 个恶性图像)。在增强数据集上执行 90% / 10% 的训练/验证划分。不对 140 张图像的测试数据集进行任何转换

Vision Transformer模型

与图像相对应的所有10x10块都被展平并投影到维度为64的线性序列。随后,将分类(CLS)标记以及可学习的位置嵌入添加到线性投影中。生成的张量作为Transformer的输入,该Transformer由8个编码层和4个用于自注意力层的头组成。然后,Transformer的输出通过多层感知机(MLP)具有两个由(全连接层、GeLU激活函数和dropout组成)。全连接层的大小分别为 2048 和 1024,而 dropout 率设置为 0.3。具有 softmax 激活函数的最终密集层用于估计图像属于两个类别中的每个类别的概率。该模型使用 Adam 优化器进行了 50 多个 epoch 的训练,学习率为 0.0001,批量大小为 32,稀疏分类交叉熵作为损失函数。

不确定性估计

通过使用 dropout 作为贝叶斯近似来量化测试数据集中每个观测值的分类结果的不确定性。将dropout添加到训练模型的最终分类层,并通过在0.1-0.6的范围内随机改变dropout率,对每个测试图像进​​行N=100次的推理过程。

认知不确定性被测量为多个推理过程中分类得分的标准差。然而,标准偏差仅提供不确定性的衡量标准,而不是与预测可靠性相关的决定,而预测的可靠性将导致放射科专家随后进行审查。

提出了一种替代指标,即分类不一致率(CIR),它将分类的不确定性量化为预测标签偏离多个推理过程中平均分类结果的次数。

P_{i,j}(0),P_{i,j}(1)表示测试数据集中观测值的概率得分,x_i,i\in[1,140]属于阴性和阳性类,分别对于一个推理过程,j,j\in [1,100]。给定观测值的CIR_i计算过程如下:

CIR_i=\frac{1}{100}\sum_{j=1}^{100}|argmax(\mu(P_{i,j}(0)),\mu(P_{i,j}(1)))-argmax(P_{i,j}(0),P_{i,j}(1))|

其中,\mu表示不同推理过程j的概率分数的平均值,如果P_{i,j}(0)\geq P_{i,j}(1),则argmax(P_{i,j}(0),P_{i,j}(1))接收值为0。如果P_{i,j}(0) < P_{i,j}(1),则接收值为1.

CIR_i=0,则表示一致,预测的结果很好。若CIR_i> 0可能表示分类结果不可靠。

这篇关于基于变压器的手持式超声图像中乳腺病变的分类不一致性测量表征的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/910863

相关文章

基于WinForm+Halcon实现图像缩放与交互功能

《基于WinForm+Halcon实现图像缩放与交互功能》本文主要讲述在WinForm中结合Halcon实现图像缩放、平移及实时显示灰度值等交互功能,包括初始化窗口的不同方式,以及通过特定事件添加相应... 目录前言初始化窗口添加图像缩放功能添加图像平移功能添加实时显示灰度值功能示例代码总结最后前言本文将

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

用Pytho解决分类问题_DBSCAN聚类算法模板

一:DBSCAN聚类算法的介绍 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法,DBSCAN算法的核心思想是将具有足够高密度的区域划分为簇,并能够在具有噪声的空间数据库中发现任意形状的簇。 DBSCAN算法的主要特点包括: 1. 基于密度的聚类:DBSCAN算法通过识别被低密

PMP–一、二、三模–分类–14.敏捷–技巧–看板面板与燃尽图燃起图

文章目录 技巧一模14.敏捷--方法--看板(类似卡片)1、 [单选] 根据项目的特点,项目经理建议选择一种敏捷方法,该方法限制团队成员在任何给定时间执行的任务数。此方法还允许团队提高工作过程中问题和瓶颈的可见性。项目经理建议采用以下哪种方法? 易错14.敏捷--精益、敏捷、看板(类似卡片)--敏捷、精益和看板方法共同的重点在于交付价值、尊重人、减少浪费、透明化、适应变更以及持续改善等方面。

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

R语言统计分析——重复测量方差分析

参考资料:R语言实战【第2版】         所谓重复测量方差分析,即受试者被测量不止一次。本例使用数据集市co2数据集:因变量是二氧化碳吸收量(uptake),自变量是植物类型(Type)和七种水平的二氧化碳浓度(conc)。Type是组间因子,conc是组内因子。Type已经被存储为一个因子变量,还需要将conc转换为因子变量。分析过程如下: # 将conc变量转化为因子变量CO2$c

PMP–一、二、三模–分类–14.敏捷–技巧–原型MVP

文章目录 技巧一模14.敏捷--原型法--项目生命周期--迭代型生命周期,通过连续的原型或概念验证来改进产品或成果。每个新的原型都能带来新的干系人新的反馈和团队见解。题目中明确提到需要反馈,因此原型法比较好用。23、 [单选] 一个敏捷团队的任务是开发一款机器人。项目经理希望确保在机器人被实际建造之前,团队能够收到关于需求的早期反馈并相应地调整设计。项目经理应该使用以下哪一项来实现这个目标?