Resnet50网络的应用—抑郁症诊断

2023-12-29 06:50

本文主要是介绍Resnet50网络的应用—抑郁症诊断,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

写在前边

本人研究生阶段的研究内容为抑郁症诊断,最近一直在想搭建件简单有效的网络,提升自己编码能力的同时,推动科研的进展。本文是总结了最近两周学习的论文中,应用到Resnet_50网络的,在此进行整理和总结。欢迎相同方向的同学交流学习。

正文

相比于之前的思路,本部分选择的是三个论文,都是借助Resnet_50网络作为核心网路的,我觉得这个方向是可以进行相应的学习和研究的。


论文名称:DEPRESSION DETECTION BASED ON DEEP DISTRIBUTION LEARNING

数据集:AVEC2013、AVEC2014

创新点:本文的出发角度是很好的,解决现在部分模型中,损失函数是基于标记的面部图像,没有明确地探讨所有面部图像与抑郁水平之间的序数关系。通过对整个个体图片的完全整理,实现对所有图对相应的抑郁分数的对应,从而降低误差。

整体结构:

整体模型图如下图:

本文将抑郁症诊断问题作为分类问题处理的,整体以一个样本的所有图片作为一个样本,对应一个label。

本文提出  expectation loss 来描述抑郁分数的分布,首先针对输入的 i 个图片Xi,Yi为对应所以的label,Zi表示系统的输出抑郁症分数,计算获取概率,

为了求得分布,先计算下期望值,其中j表示label:

 

期望损失函数就可以表示为,其中M为bath_size:

实验部分:

 预处理:1>采样,AVEC2013每100帧取一帧,AVEC2014每10帧取一帧;2>人脸对齐裁剪MTCNN工具

 模型:在VGG FACE 上训练过的Resnet_50 

 评价标准 : MSE和RMS

结果:结果效果相比于之前的模型还是有很大的进步的,这也鼓励大家从整体的角度来考虑诊断的问题。

 现阶段思路的问题:实验中,作者是将一个vedio裁剪的图片一次送入到网络中吗?图片特别多,硬件不支持的问题是怎么处理的那?


论文名称:Learning content-adaptive feature pooling for facial depression recognition in videos

数据集:AVEC2014

创新点:作者发现,针对每个图片,模型认定其对最终结果的影响权重都是一样的。显然,这样是存在问题的,因为有的帧图片中的姿势、角度并不适合系统进行相应分数诊断。所以,作者借助memory attention mechanism 来对帧图片进行权重的分配,以使得效果较好的图片对结果起到主导作用。

整体结构:

从整体来看,网络是分为两部分:Resnet_50网络提取图片特征,级联的两层attention网络进行权重分配,最后的全连层输出抑郁诊断结果,网络整体结构如下图:

通过Resnet_50网络的到的特征,然后希望通过attention机制得到聚合向量h,其中\alpha表示的是权重

       \alpha的计算如下,首先通过一纬卷积核\theta ^T的卷积计算得到重要性系数c^{_{k}}将结果输入到softmax中得到相应的权重其实仔细的考虑,这获取权重的方式正是最正经的attention的应用。

由于是级联attention机制,所以两者的关系为:

最后的损失函数可以定义为:

实验结果:相比来看,结果没有一个论文的结果好。其实在再次思考论文的时候,我意识到,在之前attention机制是对一张图使用,抓住图种表达信息的关键信息,比如常见的输出人脸的哪个表达信息的图。在本文中,是将多个图看作是主体,使用attention机制选择出贡献较好的图片


论文名称:ENCODING TEMPORAL INFORMATION FOR AUTOMATIC DEPRESSION RECOGNITION

FROM FACIAL ANALYSIS

数据集:AVEC2013、AVEC2014

创新点:在传统双流的基础上,对时间特征的预处理做了新的处理,使用的提取高级语义特征的网络为Resnet_50网络

整体结构:

从时间和空间两个角度进行抑郁症诊断的模型从2015年首次使用抑郁症诊断就开始 了,通过看这个模型图可以感受到依旧是从双流的角度出发的,不同的是主体的网络已经不再是之前的CNN网络。本文的主要创新点在于这个时间流的特征。


其实,本文考虑的问题也是各种抑郁症诊断过程中不可避免的问题-----过拟合。 文中提出了一种新的时间池方法来捕获和编码视频剪辑的时空动态到图像地图。其实在早期的文章中,也是会通过光流图实现时间特征的提取。其实现过程如下所示:

实验:

 预处理:1>采样,AVEC2013每100帧取一帧,AVEC2014每10帧取一帧;2>人脸对齐裁剪MTCNN工具

 模型:在VGG FACE 上训练过的Resnet_50 

 评价标准 : MSE和RMS

结果:这个结果如果是真实的,那么他就是我见过的最好的结果。


总结:

这是一部分我对论文的总结,其中还是有很多自己不理解的地方。由于这些论文作者都没公开代码,所以还有一些理解上的问题。现阶段,我选择使用Resnet_50网络开始搭建网路。

这篇关于Resnet50网络的应用—抑郁症诊断的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/548676

相关文章

【Altium】查找PCB上未连接的网络

【更多软件使用问题请点击亿道电子官方网站】 1、文档目标: PCB设计后期检查中找出没有连接的网络 应用场景:PCB设计后期,需要检查是否所有网络都已连接布线。虽然未连接的网络会有飞线显示,但是由于布线后期整板布线密度较高,虚连,断连的网络用肉眼难以轻易发现。用DRC检查也可以找出未连接的网络,如果PCB中DRC问题较多,查找起来就不是很方便。使用PCB Filter面板来达成目的相比DRC

通信系统网络架构_2.广域网网络架构

1.概述          通俗来讲,广域网是将分布于相比局域网络更广区域的计算机设备联接起来的网络。广域网由通信子网于资源子网组成。通信子网可以利用公用分组交换网、卫星通信网和无线分组交换网构建,将分布在不同地区的局域网或计算机系统互连起来,实现资源子网的共享。 2.网络组成          广域网属于多级网络,通常由骨干网、分布网、接入网组成。在网络规模较小时,可仅由骨干网和接入网组成

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

Toolbar+DrawerLayout使用详情结合网络各大神

最近也想搞下toolbar+drawerlayout的使用。结合网络上各大神的杰作,我把大部分的内容效果都完成了遍。现在记录下各个功能效果的实现以及一些细节注意点。 这图弹出两个菜单内容都是仿QQ界面的选项。左边一个是drawerlayout的弹窗。右边是toolbar的popup弹窗。 开始实现步骤详情: 1.创建toolbar布局跟drawerlayout布局 <?xml vers

自制的浏览器主页,可以是最简单的桌面应用,可以把它当成备忘录桌面应用

自制的浏览器主页,可以是最简单的桌面应用,可以把它当成备忘录桌面应用。如果你看不懂,请留言。 完整代码: <!DOCTYPE html><html lang="zh-CN"><head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><ti

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述。以下是从不同角度对气象站的种类和应用范围的介绍: 一、气象站的种类 根据用途和安装环境分类: 农业气象站:专为农业生产服务,监测土壤温度、湿度等参数,为农业生产提供科学依据。交通气象站:用于公路、铁路、机场等交通场所的气象监测,提供实时气象数据以支持交通运营和调度。林业气象站:监测林区风速、湿度、温度等气象要素,为林区保护和

PyTorch模型_trace实战:深入理解与应用

pytorch使用trace模型 1、使用trace生成torchscript模型2、使用trace的模型预测 1、使用trace生成torchscript模型 def save_trace(model, input, save_path):traced_script_model = torch.jit.trace(model, input)<

哺乳细胞重组表达人鼠嵌合抗体:制备与应用

重组抗体是一类具有广泛应用价值的蛋白质,在药物研发和生物医学研究中发挥着重要作用。本文将介绍重组抗体的表达方式,重点关注嵌合抗体制备和哺乳细胞重组表达人鼠嵌合抗体的技术原理和应用。 重组抗体表达的原理和方法 重组抗体表达是通过将人或动物源的免疫球蛋白基因导入表达宿主细胞,并使其表达出特异性抗体蛋白质。常用的表达系统包括细菌、哺乳细胞和真核微生物等。 嵌合抗体制备的步骤和优势 选择适当的抗原

【图像识别系统】昆虫识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50

一、介绍 昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集(‘蜜蜂’, ‘甲虫’, ‘蝴蝶’, ‘蝉’, ‘蜻蜓’, ‘蚱蜢’, ‘蛾’, ‘蝎子’, ‘蜗牛’, ‘蜘蛛’)进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一