深度学习的舌象诊断:从舌头上了解系统性疾病!

2024-06-08 08:44

本文主要是介绍深度学习的舌象诊断:从舌头上了解系统性疾病!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先

深度学习算法能否解决东方医学中依靠医生经验的诊断问题?而要实现这个目标,需要什么呢?

用舌头诊断被称为口腔健康的指标,但在东方医学中,舌头也被用来评估全身的状况。换句话说,通过分析舌头的图像,不仅可以发现特定的疾病,还可以同时发现多种疾病。因此,通过提取医生的经验作为特征和学习模型来普及非语言知识的深度学习的引入备受关注。另一方面,有人指出,这些舌象存在一个问题,就是这些舌象有冗余,无法从图像中把握整体特征。

在这项工作中,使用高方差和局部响应归一化来实现多尺度特征分析。所提出的方法可以学习高层次的特征,提供更多的分类信息。因此,它达到了很高的分类性能。

什么是东方医学、中医和舌诊?

东方医学是以中药、针灸为主的东方传统医学。西医是直接用药物或手术治疗身体不好的部分,而东方医学的目的是着眼于整个身体,而不是只治疗不好的部分,方法有针灸、中医等。此外,它还有自己的"密约"概念。"密约"的意思是还没有生病,但还没有健康,目的是防止因疲劳和积累的抵抗力而引起的疾病。

东方医学的诊断方法有"四诊",其中"望闻问切"是从面部表情、外貌等外在特征来把握身体状态的。其中,舌诊可以从舌头的状态中把握身体的状态,以无创的方式高准确度地找出病症点。千百年来,中医通过观察舌头的颜色、形状和质地来判断患者的健康状况。

但是,这种诊断方法主要是根据医生的经验,有主观的一面,所以很难向陌生人推广诊断方法。在此背景下,利用深度学习积累舌头图像并提取特征以简化诊断方法,受到了人们的关注。

传统方法的问题

虽然已经提出了很多基于颜色、形状、纹理等单一特征的模型,并取得了很好的效果,但这些模型只使用了低级特征,很难获得一定的表现力。特别是在舌头图像的异常检测中,需要整个图像的特征来获得高性能。因此,在检测舌头图像的异常时,提取多方面的综合特征,并将这些特征进行高精度整合的方法被认为是有效的。在我们之前的研究-PCANet中,我们从舌头图像中提取了这样复杂的特征。它基于PCA算法和CNN,可以适用于各种数据和任务,微调所需参数少。此外,据报道,当与机器学习分类算法相结合时,它在分类任务中表现良好。据报道,当与机器学习分类算法如K-最近邻(KNN)、SVM和随机森林(RF)相结合时,它的表现也很好。

另一方面,这种方法有两个问题:“数据处理的冗余"和"处理有偏差的样本时不准确”。关于前者,由于PCA的特性,特征值容易膨胀,导致复杂特征图的数据冗余。此外,PCANet假设样本的分布是很均衡的,数据集中的样本数量很大,所以它可能不能很好地应对不均衡的样本。

本研究的目的

在这项工作中,我们解决了这些问题,并提出CHDNet从舌头图像中提取合适的复合整体特征。它是一种监督学习模型,从无监督的临床数据中学习有用的特征,并利用获得的特征学习如何将患者的健康状态分为正常和异常。

本文提出的探索正常和异常舌头图像特征表示的方法采用了四个关键要素:非线性变换、多尺度特征分析、高方差和局部归一化。该方法可以为预测具有偏态分布的健康状况提供稳健的特征表示。

技巧

建议的方法

对于每张图像,我们从图像中去除背景,提取舌体,并应用CHDNet学习图1中正常和异常舌体的特征。然后将图像归一化为一定的高度和重量。

然后将舌头图像分为训练轮和测试轮,并训练卷积核来生成特征表示,将舌头样本分为正常或异常,并对k-folds交叉验证进行评估,对相应的k轮得到的结果进行平均。

本建议有四个重要内容高分散处理实现了每个特征图中的特征分布无冗余的特性。在对局部响应进行归一化和高分散处理后,不同特征图中同一位置的特征仍有冗余。这样我们就可以解决这个问题。

非线性变换层,主成分分析主要集中在线性分类上,所以存在因冗余而降低精度的问题。特别是当它们被用作不平衡数据的异常检测特征时,这个问题就会出现。为了解决这一问题,引入非线性分析,采用多尺度特征分析,提取精度较高的特征。此外,为了提高对变形的响应,在高方差和局部响应归一化之前,引入多尺度特征分析。

CHDNet由三部分组成:PCA滤波器卷积层、非线性变换层和特征池层,如图2所示。

非线性变换

在这一层,除了传统的批量转换过程和PCA转换外,还进行了非线性转换,以减少PCA分类中出现的冗余。在这个PCA过程中,对每幅图像应用非线性,以消除以下方程线性变换中的检测精度的粗糙。

其中T为图像,C1为第一主成分,a和ε为超参数。

此外,由于tanh(x)用于特征的卷积层,存在负值,这与视觉系统的原理相矛盾。因此,在每个卷积层后增加一个非线性变换层,其效果是将这个负值作为噪声处理。

功能池

除上述非线性变换外,该层的其他功能还包括"直方图–将像素转换为[0,255]的整数"、“多尺度特征分析–将每个直方图中的图像按分辨率汇总为特征”、“高方差–避免退化状态,增加特征间的竞争”、“局部响应归一化–不同的特征。在地图中同一位置的每个特征之间进行归一化处理,以防止冗余”。通过对输入图像进行这一系列处理,正常和异常特征比以前的方法更加突出。转化公式请参考论文。

实验准备

共收集医院267名胃炎患者和48名健康志愿者的315张图片。在特征提取步骤的训练阶段,随机选取40个正常对象和44个异常对象作为训练集,约占总图像的26.67%,用于训练卷积核和确定参数。然后,学习的内核和参数被用于提取其余231个样本的特征。结果平均为10次,交叉验证运行5次。为了评价所提出的方法和传统方法的性能,几个评价指标(精度。灵敏度、特异性、准确性和回收率)。

结果

与传统方法的比较

本次评估的目的是确定所提出的方法与之前的方法PCANet相比是否提高了性能。在本次评估中,我们使用LIBLINEAR SVM作为分类器。

结果表明,提出的高分散(HD)、局部响应归一化(LRN)、多尺度特征分析(MFA)和非线性变换(NT)的组合与PCANet相比,提高了识别率:从84.77%提高到91.44%(约7%)。另外,在样品不平衡方面,所提出的方法使灵敏度略有下降,但特异性有所提高。

分类器的比较

本次评估的目的是确定哪个分类器在检测异常图像时表现最好。

我们比较了使用LIBLINEAR SVM和其他分类器–LDA、KNN、CART、GBDT和RF作为分类器代替LIBSVM的CHDNet的性能–当样本数远小于特征数时,LIBLINEAR SVM的性能优于LIBSVM。比特征数更多–当样本数远小于特征数时,LIBLINEAR SVM的表现比LIBSVM更好。样本数为315个,每个样本中的特征数为43008个,说明LIBLINEAR SVM表现较好。

从精度、特异性、准确度、召回率和F1得分来看,LIBLINEAR SVM的整体性能在下表6种分类器中是最好的,精度91.14%–比LDA高6.24%。同时,与基于距离的模型和树形结构模型相比,特异性从3%提高到25%。通过对比可以看出,参数最优的SVM分类器的性能优于其他方法.LIBLINEAR SVM方法的性能准确率提高到91.14%,在其他分类器中是最好的。

考虑

舌象是东方医学的诊断标准之一,曾有可能无创评估整体身体状况,识别身体疾病。然而,传统模型存在着冗余性和对有偏差样本的检测精度低的问题(特别是在检测异常图像时)。在本研究中,我们提出了一种利用CHDNet这种高度分布式的模型,提取适当的特征进行图像异常检测的模型。评价结果表明,该模型的性能高于传统模型。

但我对此事的看法是这样的。

首先,不清楚为什么选择Linear SVM作为分类器,SVM通常使用RBF内核,但当需要快速计算处理海量数据时,就会使用Linear。作者解释说,原因是特征数远大于样本数,发现Linear的精度高于SVM-RBF内核的精度。不过,造成这一结果的原因没有告诉大家,也不清楚原因。

引入所提出的方法特有的非线性变换的下一个原因是卷积层的tanh(x)中存在负值,但不清楚是否考虑了其他方法,例如,使用ReLU激活函数。在图像分析领域,可以想象,激活函数可以用来剔除负值。在图像分析领域,可以设想使用激活函数:ReLU来处理负值的噪声,但没有明确说明不使用它的原因(或不能引入它),有人认为应该明确说明像现在这样的非线性变换比ReLU函数更有意义这一点。

结论

在本文中,我们提出了一种使用无监督特征学习方法进行舌头图像分类的新型框架。它使用CHDNet通过学习特征来训练一个加权的LIBLINEAR SVM分类器来检测异常患者。实验结果表明,与其他方法相比,我们的新框架和加权LIBLINEAR SVM的组合具有最好的预测性能。

这篇关于深度学习的舌象诊断:从舌头上了解系统性疾病!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1041699

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

线性代数|机器学习-P36在图中找聚类

文章目录 1. 常见图结构2. 谱聚类 感觉后面几节课的内容跨越太大,需要补充太多的知识点,教授讲得内容跨越较大,一般一节课的内容是书本上的一章节内容,所以看视频比较吃力,需要先预习课本内容后才能够很好的理解教授讲解的知识点。 1. 常见图结构 假设我们有如下图结构: Adjacency Matrix:行和列表示的是节点的位置,A[i,j]表示的第 i 个节点和第 j 个