焦虑相关症状与错误相关大脑活动的机器学习研究

2024-08-29 01:52

本文主要是介绍焦虑相关症状与错误相关大脑活动的机器学习研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要

焦虑症状可能会影响大脑对错误的加工方式。然而,许多研究报告的结果相互矛盾且不可再现,因此大脑对错误的反应(即错误相关负波[ERN];错误相关正波[Pe])与特定焦虑症状的对应关系仍不清楚。本研究收集了171名被试的16个焦虑维度自述评分,并采集了他们的EEG信号。然后,使用机器学习(1)识别与ERN/Pe增大有关的主要症状;(2)评估传统统计方法的泛化能力。本研究结果表明,ERN的振幅以及其他大脑信号变化编码了与个体错误加工相关的信息。泛化性检查结果表明,改变结果验证方法可以获得反映个体差异和临床有用生物标志物的稳健信息。

引言

认知和情感神经科学研究的主要目标是建立大脑结构与脑-行为活动之间的关系。尽管这种脑-行为关联是大多数认知神经生理学研究的重点,但研究报告的结果缺乏一致性。标准统计分析通常包括检验组间或条件间的差异,结果常以均值、标准差和置信区间来描述。但基于这种组水平进行推断可能会导致误导性结论。

正如Rouder及其同事(2021)所报告的那样,只有当群体中的所有个体都表现出相同方向的效应时,从均值进行推断才有意义。在这种情况下,效应既可以解释,也可以表示为感兴趣变量的函数;然后可以使用相同的函数来预测所有个体的效应。当群体中的个体表现出相反方向的效应或部分群体显示无效应时,情况就变得更加复杂了。这种复杂的个体差异表明,被解释的现象比从群体研究中看到的更为复杂,因此通过群体比较或简单的线性回归来分析和预测这种现象可能会产生误导性的结果。

为了解决实证研究中常用的统计方法的局限性,神经科学和实验心理学开始高度关注机器学习(ML)方法。ML技术可以提高结果的泛化性和稳健性。本研究旨在使用机器学习框架来预测人类大脑活动中与焦虑相关的症状。在这里,本研究重点关注焦虑的不同维度以及与错误相关的大脑反应。

方法

参与者

共171名健康被试(120名女性和51名男性)参加了这项研究,年龄在18-40岁之间(M=22.75岁,SD=3.60)。无药物、神经或精神疾病史,并且视力正常或已矫正至正常水平。被试的平均教育年限为15.16年(SD=2.56)。在分析之前,有8名被试因EEG数据总体质量较差而被排除。因为在小样本数据中进行机器学习分析需要高质量的数据。为确保EEG数据的质量,任何包含伪迹的数据段都被剔除。因此,有33名被试的数据因无伪迹试次段数量少于5个而被排除。最终样本包括130名被试(93名女性和37名男性)的EEG数据,这些被试的年龄在18-40岁之间(M=22.88岁,SD=3.76),平均教育年限为15.08年(SD=2.49)。

程序和任务

记录被试在执行一项快速的颜色+方向go/no-go判别任务时的EEG信号,该任务在之前的几项研究中得到了验证。该任务的实验范式如图1所示。完成任务后,让被试填写一系列自我报告问卷。所有被试签署了书面知情同意书,并获得了相应报酬。本研究遵循《赫尔辛基宣言》中的伦理原则,并获得了波兰雅盖隆大学哲学院研究伦理委员会的批准。

图1.go/no-go范式及其条件:(A)Go试次;(B)正确反应的no-go试次;(C)不正确的no-go试次,即错误反应。

测量量表

从被试填写的量表中选择以下维度进行焦虑相关现象的分析:反刍思维量表,反刍量表(RRQ);状态-特质焦虑量表,特质量表(STAI);抑郁-焦虑-压力量表-21,焦虑量表(DASS-21);行为抑制系统(BIS)量表;强迫症症状分类量表-修订版,检查、囤积、强迫观念、排序、神经中和与清洗量表(OCI-R);强迫信念量表-20,威胁高估量表;白熊抑制量表(WBSI);不确定性低容忍度量表-12,抑制性和前瞻性量表;罗森伯格自尊量表(SES)。所有评分均按照量表原作者提供的说明进行计算。

电生理记录和数据预处理

该实验由训练有素的研究人员在一间隔音室内进行。使用BioSemi Active-Two系统,以256Hz的频率连续记录64个Ag/AgCl活性电极(带有前置放大器)的EEG信号,共模感应电极(CMS)和驱动右腿电极(DRL)分别作为在线参考电极和接地电极。在左眼上方和下方,以及双眼外眦放置四个额外的电极来监测水平和垂直眼电(EOGs)。使用BrainVision软件(Brain Products GmbH)对脑电信号进行预处理。使用双侧乳突进行离线参考。首先采用Butterworth四阶高通滤波器(截止频率为0.05Hz)和二阶低通滤波器(截止频率为128Hz)进行滤波。使用50Hz的陷波滤波器去除电源线噪声。将数据进一步分割为以反应锁时的时段(-100ms~600ms)。使用Gratton、Coles和Donchin的算法进行眼动伪迹校正。伪迹拒绝标准为振幅超过±65μV阈值的试次,并对每个时段进行基线校正(前100ms)。

特征提取

在进行进一步分析之前,将数据集按3:7的比例划分为测试集和训练集。在每个数据集中,那些响应错误的无伪迹时段少于五个的受试者被排除,结果形成了一个包含34名参与者的测试(外部)数据集,以及一个包含96名参与者的训练(内部)数据集。在训练集中,每位参与者平均包含用于分析的无伪迹错误响应时段为17.03个(SD=10.80);在测试集中,为17.85个(SD=8.81)。

为了将数据的空间变异性限制在假设的感兴趣信号上,本研究选择了不同的通道子集,即ROIs(感兴趣区域)。由于这是一个数据驱动的探索性机器学习框架,本研究决定测试两个ROIs,以检查空间变异性对结果的影响。基于初步的内部一致性分析定义了七个ROIs,包括额叶、中央和顶叶通道,这些通道可能包含与错误处理相关的信号。然后,分别为Pe和ERN选择了两个ROIs,这些ROIs具有最大的平均内部一致性得分或最佳的内部一致性分布。ERN选择的ROIs如下:(ROI 1)Fpz、AFz、Fz、FCz、Cz、CPz、P1、Pz、P2;(ROI 2)Fpz、AFz、F1、Fz、F2、FCz、C1、Cz、C2、CPz、P1、Pz、P2。Pe选择的ROIs如下:(ROI 3)Fpz、AFz、Fz、FCz、C1、Cz、C2、CPz、P1、Pz、P2;(ROI 4)Fpz、AFz、F1、Fz、F2、FC1、FCz、FC2、C1、Cz、C2、CP1、CPz、CP2、P1、Pz、P2。

此外,使用40Hz的Butterworth六阶滤波器对信号进行滤波,并在每个参与者的试次中进行平均。为了提取大脑信号的空间特征,使用主成分分析(PCA)对错误响应试次进行处理。PCA成分的数量(1-4个)被视为模型的超参数,并在模型的超参数调优步骤中自动选择。本文决定将PCA成分的最大数量限制为4个,这是在过拟合、可解释性以及信息保留量之间进行权衡的结果。由于包含大量超参数的复杂模型很容易出现过拟合,因此在测试数据上的性能不佳;同时,前四个成分解释了信号中的大部分方差。每个空间成分的ERN分数和Pe分数分别以峰-峰幅值进行量化。在进行峰-峰测量之前,数据在47ms的bin上进行平均,以减少高频背景EEG噪声可能造成的干扰或失真。图2显示了详细的ERN/Pe分数提取流程。

图2.特征提取管道。

本研究还对ERN和Pe进行了经典的ERP分析。在ERP分析中,ERN量化为Fz电极在0-100ms时间窗内的平均振幅。Pe量化为Cz电极在150-350ms时间窗内的平均振幅。目标ERP成分的时间窗是基于本研究先前使用类似的实验范式进行反应抑制的研究选择的。采用线性回归进行ERP分析。

内部一致性

为了提高结果的可重复性和可比较性,本研究计算了被试内和被试间的变异性,以及特征的内部一致性。被试内和被试间变异性分别计算为被试内和被试间试次得分的标准差。内部一致性计算为被试水平的可靠性系数,如公式1所示:

其中,

为被试间方差,

为特定个体内的方差,nijk为第k组中个体j的试次i的数量。

回归模型

由于量表之间存在相关性,因此对每种焦虑相关现象进行了单独的回归分析。基于ERN或Pe的PCA得分作为自变量,量表得分作为因变量。选择以下回归模型进行分析:(1)弹性网络模型(ElasticNet)和(2)具有径向基函数核(KR-rbf)的核岭回归模型。弹性网络模型的两个超参数(λ和α)的范围分别由1e-7到1e3和1e-8到1的20个对数间隔值构成。KR-rbf将L2范数正则化的线性回归与核技巧相结合,使用系数的线性组合来捕捉非线性关系。L2范数正则化的强度(α)是模型的超参数,其取值范围包括20个对数间隔值,从1e-5到1e3。

验证策略

本研究使用三折交叉验证来确定模型的超参数,这是在训练集大小和训练持续时间之间的权衡。采用决定系数R2分数对模型进行评估。一旦确定了在任务中表现最佳的估计器及其最佳超参数,就会进行额外的验证。这种额外的验证包括:(1)使用R2分数评估模型在测试数据集上的性能;以及(2)评估其结果的统计显著性。测试数据集包含量表得分和EEG数据;需要注意的是,在模型训练过程中并未使用测试数据集。验证过程中的模型使用了与训练时相同的处理方法,因为特征提取步骤是模型的一部分。通过置换检验评估结果的统计显著性,置换次数为(n=10000)。本研究未进行多重比较校正,因为研究中将每个量表-ERN/Pe模型视为单独的假设。模型的训练和验证流程如图3所示。

图3.模型训练和验证管道。

使用 MNE-Python、Pandas、Scikit-learn和NumPy Python软件包进行分析。

结果

行为结果

在训练集中,被试的平均错误响应次数为29.75次(SD=16.19),正确响应次数为221.38次(SD=7.14);在测试集中,平均错误响应次数和正确响应次数分别为31.88次(SD=17.08)和222.18次(SD=2.97)。在训练集中,错误响应的平均反应时(RT)为282ms(SD=43ms),正确响应RT为329ms(SD=39ms)。正如预期的那样,被试在错误试次中的反应速度显著快于正确试次(p<.001)。在测试集中,错误响应的平均RT为295ms(SD=62ms),正确响应为334ms(SD=43ms)。同样,相对于正确试次,被试在错误试次中的反应速度明显更快(p<.001)。表1显示了训练数据集中量表数据的描述统计量和相关性。

表1.训练数据集中量表的描述性统计和相关性。

EEG特征

为了提高信噪比并区分ERP特征,本研究对分段信号应用了主成分分析(PCA)。ERN和Pe的成分权重和振幅如图4所示。

图4.提取的PCA成分的总平均值及其相应的空间模式。

在本研究的分析中,第一个PCA成分的方差解释性最大,对应于ROI中包含的EEG信号的平均值。因此,第一个PCA成分很可能是错误监测过程强度的标志。本研究假设这个成分的非零系数反映了与错误监测强度相关的个体差异。第二、第三和第四个成分评估了与错误相关大脑信号的空间分布:对于每个成分,假设一个非零系数对应于预期的ERN/Pe空间位置和分布,即与图4所示的模式高度相似。由于存在右半球偏侧化,第四个成分可以被视为与错误相关的大脑活动偏侧化的标志。

本研究还对经典的ERN波形进行了分析。对于ERN波,量化为电极Fz处0-100ms时间窗内的平均振幅,训练集中的平均振幅为-4.98μV(SD=4.65μV);测试集中的平均振幅为-4.48μV(SD=3.93μV)。对于Pe波,量化为电极Cz处150-350ms时间窗内的平均振幅,训练集的平均振幅为1.51μV(SD=6.78μV);测试集为1.37μV(SD=8.16μV)。训练集和测试集的ERN(p=0.595)和Pe(p=0.337)振幅没有显著差异。

内部一致性

为了比较研究结果并评估结果的稳定性,本研究报告了ERN和Pe的内部和外部变异性,以及内部一致性。不同条件(数据集类型和ROIs)下的内部一致性范围为0.53-0.98。图5显示了ERN和Pe内部一致性的摘要统计信息。

图5.在训练集(内部)和测试集(外部)中,对被试的ERN振幅(A)和Pe振幅(B)的变异性(σ)以及可靠性系数(jk)的估计。

ERN与量表得分

本研究检验了ERN振幅与自我报告量表分数之间的关联。在内部验证过程中,大多数量表与ERN之间存在显著的相关关系(p<.05),交叉验证后的R2均值在0.02-0.15之间变化(表2),但这种相关关系在不同的空间特征上存在差异。

表2.基于ERN的模型结果。

为了检验研究结果是否受到一个或多个潜在因素的影响,本研究进行了探索性典型相关分析(CCA)。在CCA中纳入了七个变量(四个与ERN相关的PCA成分和三个与焦虑相关的症状),以及三个维度。结果表明存在两个潜变量;第三个CCA维度几乎不能区分这些变量。前两个CCA维度形成了四个可见的聚类,分别用于分离思维反刍、不确定性不耐受和威胁高估,并区分它们与错误相关大脑活动的关系。图6显示了这些变量在CCA空间中的投影。

图6.基于ERN的典型相关分析(CCA)结果。

Pe与量表得分

此外,本研究检验了Pe振幅与自我报告量表分数之间的关联。Pe与量表相关的平均交叉验证R2范围为-0.3~0.2(表3)。

表3.基于PE的模型结果。

为了检验研究结果是否受到一个或多个潜在因素的影响,本研究进行了探索性CCA分析。在CCA中纳入了六个变量(三个与Pe相关的PCA成分和三个与焦虑相关的症状),以及三个维度。结果表明存在一个潜变量,可能影响PCA成分和焦虑症状之间的关系。图7显示了这些变量在CCA空间中的投影。

图7.基于Pe的典型相关分析(CCA)结果。

结论

本研究探讨了错误相关大脑活动与焦虑症状之间的关联。具体而言,ERN增加与思维反刍和威胁高估有关,而ERN减弱与不确定性不耐受相关。Pe与行为抑制、思维反刍和前瞻性不确定性相关。这些发现不仅证明了焦虑现象的多样性,并且支持了ERN是对不确定威胁的敏感性指标的观点。此外,本研究结果进一步说明了空间滤波在提取空间脑信号特征方面的优越性。个体在错误监测中的差异不仅仅受到错误监测强度的影响,还受到其他空间动态因素的影响。错误相关的大脑活动变异性可以部分通过偏侧化来解释,尤其是在行为抑制、思维抑制、威胁高估、思维反刍和自尊等方面。这一发现强调了ERP ERN振幅反映了多种认知机制,并不仅限于与错误加工强度相关的变异性。最后,本研究分析证明了统计模型容易出现过拟合的问题,并支持使用机器学习技术来提高脑-行为模型的可靠性和泛化能力。

参考文献:Anna Grabowska, Filip Sondej, Magdalena Senderecka; A Machine Learning Study of Anxiety-related Symptoms and Error-related Brain Activity. J Cogn Neurosci 2024; 36 (5): 936–961. doi: https://doi.org/10.1162/jocn_a_02126

小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~

这篇关于焦虑相关症状与错误相关大脑活动的机器学习研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1116508

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

线性代数|机器学习-P36在图中找聚类

文章目录 1. 常见图结构2. 谱聚类 感觉后面几节课的内容跨越太大,需要补充太多的知识点,教授讲得内容跨越较大,一般一节课的内容是书本上的一章节内容,所以看视频比较吃力,需要先预习课本内容后才能够很好的理解教授讲解的知识点。 1. 常见图结构 假设我们有如下图结构: Adjacency Matrix:行和列表示的是节点的位置,A[i,j]表示的第 i 个节点和第 j 个