你可以永远相信铁死亡,4+机器学习+分型+实验的干湿结合机制

2023-10-18 16:36

本文主要是介绍你可以永远相信铁死亡,4+机器学习+分型+实验的干湿结合机制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天给同学们分享一篇铁死亡+机器学习+分型+实验的生信文章“Identification of Ferroptosis-Related Biomarkers for Diagnosis and Molecular Classification of Staphylococcus aureus-Induced Osteomyelitis”,这篇文章于2023年4月26日发表在J Inflamm Res期刊上,影响因子为4.5。
e62c58668feeae0bd2e945f99e7425c8.jpeg

金黄色葡萄球菌(SA)引起的骨髓炎(OM)是骨科中最常见的难治性疾病之一。早期诊断有助于改善患者的预后。铁死亡在炎症和免疫反应中起着关键作用,而铁死亡相关基因(FRGs)在SA引起的OM中的机制仍不清楚。本研究旨在通过生物信息学确定铁死亡相关基因在SA引起的OM的诊断、分子分类和免疫浸润中的作用。


1. 在训练集中识别差异表达基因(DE-FRGs)

在合并和消除批次效应后的85个SA诱导的OM样本和35个正常样本中,获得了41个差异表达的基因(DE-FRGs),其中30个显著上调,11个显著下调。聚类热图的结果(图1a)显示了这41个差异表达基因在不同样本中的表达情况。这些基因的相关性分析(图1b)显示,SLC38A1与ATG7、TLR4、CTSB和LAMP2呈显著负相关,与CIRBP呈显著正相关。除了与BID呈负相关外,MAPK9与其他40个差异表达基因没有相关性。

f0060006584d0483f1aa911858787e2d.jpeg

图1 OM中DE-FRG的表达水平和相关性


2. 差异表达功能富集分析

我们通过基因富集分析进一步探索了41个差异表达的FRG的生物功能和通路。在GO富集分析中(图2a和b),对氧化应激的反应、富含菲科林-1的颗粒和DNA结合转录激活因子活性以及RNA聚合酶II特异性是BP、CC和BF最显著富集的GO术语。在KEGG通路分析中(图2c),差异表达基因主要参与了坏死程序、脂质和动脉粥样硬化以及HIF-1信号通路。因此,上述证据表明,差异表达的FRG可能通过参与凋亡和转录因子的调控,在SA诱导的OM的发病机制中发挥作用。

d87e6dac465ed363ba588673289d0181.jpeg

图2 GO和KEGG通路中差异表达基因的功能富集分析


3. 根据显著的差异表达功能基因(DE-FRGs),为OM确定了诊断生物标志物

为了区分OM患者和健康样本,我们进一步筛选了诊断基因,并将LASSO和SVM-RFE两种机器学习算法引入到训练集(GSE6269和GSE16129数据集)中。具体而言,我们使用逻辑回归算法进行了10轮交叉验证,并从41个差异表达基因中选择了11个显著的基因标志物(图3a和图3b),然后,通过SVM-RFE算法筛选出了41个DE-FRGs,并选择了18个显著的基因生物标志物(图3c和3d)。从LASSO和SVM-RFE模型中获得的遗传生物标志物进行了交集运算,最终得到了8个显著的生物标志物(SLC38A1、MAPK9、SNCA、KLF2、EGR1、STAT3、SREBF2和ABCC5)(图3e)。基于这8个显著的生物标志物绘制了ROC诊断曲线,所有基因的AUC值均大于0.65,表明每个显著基因生物标志物都能很好地区分OM样本和健康样本(图4a)。有趣的是,我们使用了“glmnet”包建立了一个Logistic回归模型,ROC曲线的结果显示,基于八个特征基因标记的回归模型的准确性高于单个基因标记的诊断效率(AUC=0.993,95% CI: 0.979–0.100)(图4b)。最后,我们使用“rms”包构建了一个诊断OM发生率的图表模型(图4c)。校准曲线的结果显示,该图表模型的预测基本与理想模型一致(图4d),基于该模型的临床决策对于SA诱导的OM患者可能是有益的(图4e)。

1c781ba021be45775e0b4e43934cdcf3.jpeg

图3 根据显著的差异表达功能基因(DE-FRGs),确定了8个口腔黏膜炎(OM)的诊断生物标志物


64b5a711fc41379e9a13210cfef53249.jpeg

图4 基于8个诊断生物标志物的ROC曲线和Nomogram模型


4. 诊断生物标志物与OM相关富集途径相关联

为了进一步探索与SA诱导的OM诊断相关的8个特征生物标志物的分子机制,通过ssGSEA-KEGG通路富集分析对每个基因生物标志物进行了分析。图表显示了最多的前6个富集通路(图5a-d)。综合分析结果表明,这8个特征生物标志物在细胞周期、fc-gamma-r介导的吞噬作用、溶酶体、核糖体、剪接体、轴突引导、细胞黏附分子、受体相互作用(细胞外基质受体相互作用、神经活性配体受体相互作用和细胞因子-细胞因子受体相互作用)和脂质代谢(甘油磷脂代谢和肌醇磷酸代谢)等通路中显著富集。此外,这些基因生物标志物还在多个信号通路(类似结节受体信号通路、TGF-beta信号通路和ERBB信号通路)和多种疾病(小细胞肺癌、致心律失常性右室心肌病和肌萎缩性脊髓侧索硬化症)中显著富集。

f1484a15f0d71b875192b89dd9dc0d10.jpeg

图5

 

根据每个生物标志物的中位表达水平,SA诱导的OM样本被分为高表达组和低表达组,并通过GSVA富集分析探索了两组之间的富集通路。综合分析的结果表明,SLC38A1的高表达可能会激活补体和凝血级联反应、泛酸和辅酶A生物合成以及柠檬酸循环TCA循环通路,而SLC38A1的低表达可能会激活烟酸和烟酰胺代谢以及近曲小管碳酸氢盐回收通路(图6a)。EGR1的高表达与α-亚麻酸代谢、DNA复制和花生四烯酸代谢有关,而EGR1的低表达与肠道免疫网络中的IgA产生和乳糖和新乳糖系列的糖脂生物合成有关(图6b)。与EGR1一致,KLF2的高表达也可能激活花生四烯酸代谢和α-亚麻酸代谢通路,而KLF2的低表达可能激活自身免疫性甲状腺疾病和近曲小管碳酸氢盐回收通路。在STAT3高表达组中,与氨基酸代谢相关的途径(酪氨酸代谢、烟酸和烟酰胺代谢以及丁酸代谢)显著富集,而在STAT3低表达组中,补体和凝血级联反应以及乙酰乙酸和二羧酸代谢富集。SREBF2的高表达仅与视黄醇代谢和亚油酸代谢有关,而SREBF2的低表达主要与肠道免疫网络中的IgA产生和乳糖和新乳糖系列的糖脂合成有关。同样,SNCA的高表达仅与烟酸和烟酰胺代谢以及丁酸代谢有关,而SNCA的低表达主要与乙酰乙酸和二羧酸代谢以及甘氨酸、丝氨酸和苏氨酸代谢有关。高表达的MAPK9仅与碱基切除修复途径有关,而高表达的ABCC5仅与牛磺酸和低牛磺酸代谢有关。这些结果表明,8个显著的生物标志物可能通过免疫反应和氨基酸代谢相关途径调节SA诱导的OM的发病机制。

67500022e0ae4cf8815e73c7048dd994.jpeg

图6 根据每个基因生物标志物的表达水平,高表达组和低表达组之间的差异激活途径


5. 免疫微环境分析

SA引起的中耳炎的病理生理机制涉及炎症和免疫反应,许多免疫细胞和因子参与了其发病机制。因此,为了探索SA引起的中耳炎的免疫反应机制,我们使用CIBERSORT算法评估了中耳炎患者和健康患者之间免疫细胞丰度的差异(图7a)。结果显示,中耳炎样本中T细胞滤泡辅助细胞、T细胞调节细胞(Tregs)、单核细胞、巨噬细胞M0、巨噬细胞M2、静息型肥大细胞、嗜酸性粒细胞和中性粒细胞的丰度显著高于对照样本,而记忆型B细胞、CD4纯化T细胞和静息型自然杀伤细胞的丰度显著低于对照样本。免疫相关性分析结果表明,SLC38A1和KLF2与巨噬细胞M2呈强烈负相关,而SREBF2、STAT3和EGR1与中性粒细胞呈强烈正相关(图7b)。SA引起的中耳炎的免疫微环境可能与SLC38A1、KLF2、SREBF2、STAT3和EGR1有关。

55541c94ec7bb70ac7ed951c8847f81c.jpeg

图7 免疫微环境分析


6. 基于显著差异表达基因的分子亚型结果

基于8个重要的生物标志物,共建立了9个聚类结果。为了筛选出最适合的分子亚型,一致性得分和CDF值被用作参考(图8a-c)。最佳的聚类结果是K=2,一致性得分接近1.0。为了验证亚型1和亚型2样本之间的差异,PCA显示不同亚型之间的转录组存在显著差异(图8d)。然后,箱线图和相关热图的结果显示,MAPK9、SNCA、KLF2和STAT3在亚型1中高表达,而SLC38A、EGR1和ABCC5在亚型2中高表达(图9a和b)。最后,我们探索了亚型1和亚型2之间的免疫微环境特征的差异(图9c和d)。结果显示,亚型1的OM具有更高的免疫细胞浸润率,主要是T细胞CD4记忆静止态、巨噬细胞M0、巨噬细胞M2、树突状细胞静止态和树突状细胞活化态。亚型2的OM中,T细胞CD4幼稚态和NK细胞静止态的浸润丰度较高。

3573cfdb160871f4550b22b9dfad1c49.jpeg

图8 基于8个基因生物标志物的聚类分析得出的分子亚群

48fb0e2fb66311a90190d5954ee854b5.jpeg

图9 两个不同簇之间基因表达水平和免疫微环境特征的差异


7. 基于验证集的诊断、表达和临床相关性分析的验证

为了验证基于8个显著生物标志物的逻辑回归模型在区分SA诱导的OM样本和正常样本方面的能力,我们使用了GSE30119数据集作为验证集。ROC曲线分析的结果表明,8个显著生物标志物能够区分OM样本和正常样本(图10a)。此外,我们验证了39个OM样本和44个健康样本之间8个特征生物标志物的表达差异(图10b-i),结果显示SNCA、EGR1、SREBF2、MAPK9和STAT3在OM样本中高表达,而SLC38A1、KLF2和ABCC5在OM样本中低表达(P<0.05),这与训练集分析的结果一致。临床相关性分析的结果显示,除了STAT3与OM患者年龄之间存在正相关外,其他基因生物标志物与年龄之间没有显著相关性(图11a-h)。

23ca9b381c3ae7349c317a14c688601e.jpeg

图10 验证集中的逻辑回归模型和基因生物标志物的表达水平

4c00ffd45a95da6834a9bf7929b3c661.jpeg

图11 8个基因生物标志物与OM患者年龄之间的临床相关性分析


8.8个基因生物标志物与OM患者年龄之间的临床相关性分析

为了验证8个基因标记物的表达水平,我们建立了和验证了OM大鼠模型,通过RT-qPCR实验(图12a-h)。RT-qPCR结果表明,MAPK9、SNCA、EGR1、STAT3和SREBF2在OM病变组织中高表达,而SLC38A1和KLF2在对照组中高表达。基因表达趋势与训练集(GSE6269和GSE16129数据集)和验证集(GSE30119数据集)完全一致。此外,虽然OM组和对照组的ABCC5 mRNA表达水平没有显著差异,但与GSE30119数据集中的基因表达趋势一致。

5b117bfa114d99bf33bead8b81c11959.jpeg

图12 RT-qPCR验证


总结

总之,SLC38A1、MAPK9、SNCA、KLF2、EGR1、STAT3、SREBF2和ABCC5被确定为特征生物标志物。我们建立了一个对SA诱导的OM患者进行诊断的模型,具有良好的诊断价值。基于8个特征的铁死亡相关基因,在亚型1和亚型2的OM之间存在显著的免疫微环境差异。这项研究将有助于开发SA诱导的OM的早期诊断指标和免疫治疗方法。

这篇关于你可以永远相信铁死亡,4+机器学习+分型+实验的干湿结合机制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/233824

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

JVM 的类初始化机制

前言 当你在 Java 程序中new对象时,有没有考虑过 JVM 是如何把静态的字节码(byte code)转化为运行时对象的呢,这个问题看似简单,但清楚的同学相信也不会太多,这篇文章首先介绍 JVM 类初始化的机制,然后给出几个易出错的实例来分析,帮助大家更好理解这个知识点。 JVM 将字节码转化为运行时对象分为三个阶段,分别是:loading 、Linking、initialization

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识