利用关系感知一致性和虚拟特征补偿解决医学分类中的长尾问题

本文主要是介绍利用关系感知一致性和虚拟特征补偿解决医学分类中的长尾问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • Combat Long-Tails in Medical Classification with Relation-Aware Consistency and Virtual Features Compensation
    • 摘要
    • 方法
    • 实验结果

Combat Long-Tails in Medical Classification with Relation-Aware Consistency and Virtual Features Compensation

摘要

由于患病样本稀缺,医学图像数据集存在天然的不平衡,导致诊断算法对多数类别产生偏见。这一情况降低了诊断性能,特别是在识别罕见类别方面。现有研究将这一挑战描述为长尾问题,并采取解耦策略来减轻分类器的偏见。但是这些研究仅使用不平衡的数据集来训练编码器,并通过舍弃主要类别的样本来重新训练分类器,从而限制了诊断性能。

本文提出了一种分为两个阶段的多视图关系感知一致性和虚拟特征补偿(MRC-VFC)框架。

  1. 在第一阶段,设计了一种多视图关系感知一致性(MRC)用于表示学习,为编码器的训练提供了无偏的指导,除了不平衡的监督。
  2. 在第二阶段,为了生成一个公正的分类器,提出了虚拟特征补偿(VFC)来通过生成大量平衡的虚拟特征重新校准分类器。与重新采样相比,VFC 补偿了少数类别,优化了一个无偏的分类器,并保留了大多数类别的完整知识。在两个长尾公共基准测试上进行的大量实验验证了 MRC-VFC 框架明显优于现有算法。
  3. 代码地址

方法

在这里插入图片描述
图 1. MRC-VFC框架:在第一阶段,利用MRC模块对不平衡数据集上的编码器进行表示学习。在第二阶段,通过期望最大化的两步过程,使用VFC重新校准分类器。
采用KL散度测量输出损失:
在这里插入图片描述
基于batch的损失和基于channel的损失
在这里插入图片描述
提及解耦方法的介绍,两阶段方法分离了编码器和分类器的训练,以消除分类器中的偏差,同时保留了编码器的表示学习。然而,大多数现有的解耦方法在第二阶段采用了重新采样策略,以重新平衡数据类别分布,导致了重新采样的固有缺点,即丢弃主类别样本。为了解决这个问题,提出了虚拟特征补偿方法,根据多变量高斯分布为每个类别生成虚拟特征,以应对长尾问题。与现有的重新采样方法不同,VFC模块产生的特征向量保留了类别之间的相关性和来自编码器的语义信息。给定类别k,首先计算均值和协方差,得到该类别的高斯分布。

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这篇关于利用关系感知一致性和虚拟特征补偿解决医学分类中的长尾问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/992021

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

好题——hdu2522(小数问题:求1/n的第一个循环节)

好喜欢这题,第一次做小数问题,一开始真心没思路,然后参考了网上的一些资料。 知识点***********************************无限不循环小数即无理数,不能写作两整数之比*****************************(一开始没想到,小学没学好) 此题1/n肯定是一个有限循环小数,了解这些后就能做此题了。 按照除法的机制,用一个函数表示出来就可以了,代码如下

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

如何解决线上平台抽佣高 线下门店客流少的痛点!

目前,许多传统零售店铺正遭遇客源下降的难题。尽管广告推广能带来一定的客流,但其费用昂贵。鉴于此,众多零售商纷纷选择加入像美团、饿了么和抖音这样的大型在线平台,但这些平台的高佣金率导致了利润的大幅缩水。在这样的市场环境下,商家之间的合作网络逐渐成为一种有效的解决方案,通过资源和客户基础的共享,实现共同的利益增长。 以最近在上海兴起的一个跨行业合作平台为例,该平台融合了环保消费积分系统,在短

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监

缓存雪崩问题

缓存雪崩是缓存中大量key失效后当高并发到来时导致大量请求到数据库,瞬间耗尽数据库资源,导致数据库无法使用。 解决方案: 1、使用锁进行控制 2、对同一类型信息的key设置不同的过期时间 3、缓存预热 1. 什么是缓存雪崩 缓存雪崩是指在短时间内,大量缓存数据同时失效,导致所有请求直接涌向数据库,瞬间增加数据库的负载压力,可能导致数据库性能下降甚至崩溃。这种情况往往发生在缓存中大量 k

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

POJ1269 判断2条直线的位置关系

题目大意:给两个点能够确定一条直线,题目给出两条直线(由4个点确定),要求判断出这两条直线的关系:平行,同线,相交。如果相交还要求出交点坐标。 解题思路: 先判断两条直线p1p2, q1q2是否共线, 如果不是,再判断 直线 是否平行, 如果还不是, 则两直线相交。  判断共线:  p1p2q1 共线 且 p1p2q2 共线 ,共线用叉乘为 0  来判断,  判断 平行:  p1p

pip-tools:打造可重复、可控的 Python 开发环境,解决依赖关系,让代码更稳定

在 Python 开发中,管理依赖关系是一项繁琐且容易出错的任务。手动更新依赖版本、处理冲突、确保一致性等等,都可能让开发者感到头疼。而 pip-tools 为开发者提供了一套稳定可靠的解决方案。 什么是 pip-tools? pip-tools 是一组命令行工具,旨在简化 Python 依赖关系的管理,确保项目环境的稳定性和可重复性。它主要包含两个核心工具:pip-compile 和 pip