4+内质网应激+预后模型教你如何应用到自己的生信分析研究中。

2023-10-13 03:04

本文主要是介绍4+内质网应激+预后模型教你如何应用到自己的生信分析研究中。,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天给同学们分享一篇内质网应激+预后模型的生信文章“Characteristics of endoplasmic reticulum stress in colorectal cancer for predicting prognosis and developing treatment options”,这篇文章于2023年3月31日发表在Cancer Med期刊上,影响因子为4。
6caec5d8a2cdb8f79eb59251d651acc1.jpeg

越来越多的证据支持内质网应激(ERS)在结直肠癌(CRC)中起着重要作用。在本研究中,作者开发了一个与ERS相关的基因(ERSRGs)模型,以帮助评估和治疗CRC患者的预后。


1. ERSRGs的富集分析

首先,作者在GeneCard数据库中搜索关键词“内质网应激”,以识别一组ERSRGs。使用|log2FC| = 0.585和FDR <0.05作为阈值进行基因表达水平比较,共检测到220个DEGs。然后对DEGs的富集进行分析,GO和KEGG结果显示主要与内质网、内质网腔、ERS、内质网蛋白质加工、免疫相关信号通路和CRC相关。这些结果表明ERS在CRC的发展中起着关键作用。


2.&nbsp;筛选EERSRGs并构建风险评分模型

对220个差异表达基因进行了单变量Cox回归分析,发现了与预后相关的26个基因(p < 0.05)(图1A)。首先,总结了样本中ERSRGs的体细胞突变情况。在541个带有突变信息的CRC样本中,共有115个ERSRGs发生了突变,突变频率为21.26%(图1B)。ATP2A1、PARGC1A和CNGA3的突变率≥4%,其中ATP2A1的突变率最高,达到了5%。然而,LEP、CXCL1、HAMP、C3orf70、SNCG、UTS2和NOL3在CRC样本中的突变率没有显著变化。重要的是,在与预后相关的26个ERSRGs中存在显著的共同突变特征(图1C)。此外,作者分析了这些ERSRGs的拷贝数变化,并观察到这些基因的拷贝数变化频率存在显著差异,FABP4、TERT、C3orf70和ADIPOQ的拷贝数增加,而NGF、UTS2、GRP和SNCG的拷贝数减少,共同表明ERSRGs的异常表达(图1D、E)。鉴于ERS在CRC中的重要作用,作者试图开发一个ERS预后风险评分模型,以更准确地评估CRC患者的状况。构建风险评分模型所涉及的CRC样本的临床信息如表1所示。然后通过LASSO Cox回归分析筛选出16个基因(DDIT3、TERT、PPARGC1A、ATP2A1、GRP、TRAP1、CD36、CXCL1、TRPV3、UTS2、OGT、NOL3、STC2、BDNF、TIMP1和C3orf70)来构建模型(图1F,G)。根据风险评分的中位数将训练集中的高风险组(n = 270)和低风险组(n = 270)进行划分。验证集以相同的方式划分,主成分分析(PCA)显示该模型能够有效地将CRC样本分为高风险和低风险组(图1H,I)。

4954085469de9e75fa5797c913de2b0c.jpeg

图1 建立ERS风险评分模型


3.&nbsp;训练集和验证集样本的风险预测和生存状态

从数据集中生成了风险曲线,其中风险评分可视化了两组患者的风险评分(图2A、B)。分析发现高风险组患者的预后较差,随着风险评分的增加,死亡率也增加(图2C、D)。接下来,风险直方图在风险评分模型中直观评估了生存状态。低风险评分的患者生存率显著较高,进一步证明该模型能够准确地分层患者。此外,作者使用热成像技术比较了影响患者预后的ERSRGs在两个风险组之间的表达水平。BDNF、GRP、CD36、TIMP1、DDIT3、OGT、STC2、ATP2A1、NOL3、TERT、TPRV3和UTS2在高风险组中表达水平较高,而PPARGC1A、C3orf70、CXCL1和TARP1的表达水平较低(图2E、F)。作者还发现这些基因之间存在显著关联。

1657239d4248e1902d6a68c165d20345.jpeg

图2 ERS模型中患者的风险预测以及模型中包含的基因表达水平


4.&nbsp;模型的预测能力

在训练集中,高风险组的OS低于低风险组(p < 0.001)(图3A)。使用ROC曲线验证模型对患者OS的预测效果,1年、3年和5年的AUC结果分别为0.72、0.76和0.77(图3B)。为了检查模型的可靠性,作者在验证集(GSE40967)上进行了测试。高风险组的患者OS较低于低风险组(p < 0.001)(图3C)。验证集的AUC值如图3D所示。为了进一步验证预后模型的准确性,作者在GSE17538数据集中再次验证(p < 0.005)。结果显示高风险组患者的OS较低,并且ROC的AUC值表现良好(图3E,F)。通过计算,作者的模型的R平方约为0.70,这表明作者的预后风险评分模型的预测能力是可接受的。

e808f544d57c6da76ce75c0e509ce21b.jpeg

图3 ERS预后风险模型与临床病理特征之间的关系及其对生存的预测价值


5.&nbsp;预测模型的预测性能比较

为了验证ER应激预后风险评分模型的优越性,通过ROC将之前结直肠癌研究中的模型与作者的模型进行比较。第一个是研究脂质代谢的模型,根据研究者的名字称之为杨氏标志。第二个是研究甲基化的模型,称之为谭氏标志。第三个是研究免疫相关基因的模型,称之为温氏标志。第四个是研究脂肪酸代谢的模型,称之为丁氏标志。根据模型中的基因,作者使用R软件包进行ROC分析。结果显示,作者构建的ERS预后风险评分模型在1年、3年和5年的AUC值均高于其他四个模型(图4A-D)。这意味着作者的风险评分模型具有更好的预测性能。

e96b29d4867bfe639e8698e7f9f6d67d.jpeg

图4 不同预后模型的预测性能


6.&nbsp;临床病理特征与风险评分的关联

由于不同的临床病理特征对疾病预后有不同的影响,因此还探讨了风险评分模型中临床病理特征的分布情况。结果表明,风险评分与肿瘤进展最为密切相关。尽管风险评分在年龄或性别上没有显著差异(图5A、B),但随着TNM分期和病理分期的升高,风险评分也随之增加(图5C-F)。接下来,比较了风险评分、年龄、性别和病理分期对预后的预测能力,结果显示风险评分的AUC值最高(0.786),表明风险评分具有最佳的预测能力(图5G)。C-指数显示风险评分的表现优于其他临床特征,预测结果的准确性更高(图5H)。图5I、J显示年龄和风险评分是OS的独立预测因子(p < 0.001)。

1c653a4bf76955ae723254bfc996c8d8.jpeg

图5 风险评分模型与临床特征之间的关系


7.&nbsp;构建预测生存率的诺莫图

通过将性别、风险评分、病理分期和年龄从训练集中结合起来,构建了一个预测结直肠癌(OS)的图表模型(图6A)。1年、3年和5年的校准曲线展示了该图表模型的准确性(图6B)。Cox回归分析最终揭示了只有图表模型是独立的预测因子(p < 0.05)(图6C、D)。图6E-G展示了风险评分、图表模型、年龄、性别和病理分期在1年、3年和5年的AUC,其中图表模型的AUC分别为0.780、0.812和0.823,最高(图6H-J)。DCA分析包含了1年、3年和5年的各种临床病理特征。树状图直观地显示了预后风险评分模型的图表模型在1年、3年和5年的DCA曲线中表现最佳。

6d3b3ef948b10a99eda532917fbea033.jpeg

图6 通过整合训练集中的ERS风险评分和临床病理特征,创建了一个用于预测CRC预后的图表


8.&nbsp;化疗的反应和相关基因表达的变化

由于结直肠癌(CRC)患者常规在手术后接受化疗,因此探索了模型中患者对化疗药物的反应。使用R软件中的“pRRophetic”分析了风险评分与化疗治疗效果之间的关联。低风险组样本对5-FU的治疗效果较好,而随着风险评分的增加,IC50也增加(图7A、B)。进展无病生存期(PFS)在训练集的亚组之间也显示出显著差异,表明风险评分可以对化疗耐药患者进行分层(p < 0.001)(图7C)。突变型BRAF和TP53以及野生型APC的风险评分较高(图7D-G)。此外,与m6A相关的大多数基因在ERS预后风险评分模型中差异显著,如YTHDF2、YTHDF3、FTO、METTL4、RTCB、GPM6A、SRSF3和CAPRIN1,这些基因可能有助于寻找化疗耐药的治疗靶点(图7H)。

1802fc135ef64b134cf2c0490dc9571d.jpeg

图7 ERS预后风险评分模型在化疗中的作用


9.&nbsp;ERS预测模型中的免疫相关特征

ESTIMATE评分(p < 0.001),免疫评分(p < 0.05)和基质评分(p < 0.001)在两组之间存在显著差异,表明ERS深刻影响免疫和基质细胞浸润(图8A)。图8B、C显示了免疫评分和基质评分与风险评分的相关性。接下来,使用不同软件研究了侵袭性免疫细胞的风险评分。此外,作者发现高风险组中免疫抑制细胞浸润更为丰富,调节性T细胞(Tregs)水平较高,这与高风险组的生存劣势一致,而低水平浸润的T细胞CD4记忆静止(p < 0.001),静止树突状细胞(p < 0.01),活化树突状细胞(p < 0.001)和浆细胞(p < 0.001)(图8D)。在先前的报告中,I型干扰素(IFN-I)信号的激活可以使肿瘤患者从免疫疗法中受益。在本研究中,高风险组中IFN-I反应得到增强,这意味着免疫抑制患者可以通过免疫疗法改善预后(图8E)。为了预测结直肠癌患者对免疫治疗的反应,进一步研究了免疫检查点与内质网应激反应(ERS)之间的相关性(图8F)。作者的研究结果显示,ERS风险评分与大多数免疫检查点呈正相关,如PDCD1(PD-1)、CD274(PD-L1)、CTLA-4、LAG3、TIGIT和HAVCR2(TIM-3)。此外,作者发现高风险组中PD-1、TIGIT、TIM-3和CTLA-4的表达较高。通过免疫治疗队列,探索了ERS风险模型预测结直肠癌预后的能力。结果显示,在没有任何免疫治疗的情况下,高风险组患者对免疫治疗的反应明显较差,并且当仅使用针对CTLA4的免疫治疗时,这一结果仍然存在(图8G,H)。此外,作者获得了训练集的TIDE预测分数,并在ERS风险组之间进行了分析。随着TIDE预测分数的增加,预后结果下降,再次表明低风险组具有更好的预后。接下来,对模型的不同亚组进行免疫抑制基因表达的分析显示,高风险组中大多数免疫抑制基因的表达水平增加,这可能解释了该组患者免疫治疗效果不佳。

58eb263160977c000f819fc33a3e9eac.jpeg

图8 ERS预后风险评分模型中的免疫相关特征


10.&nbsp;模型中差异表达基因的功能富集分析和蛋白质相互作用网络

为了更好地理解基因的作用,对两个风险组的差异表达基因进行了功能富集分析。GO结果显示这些基因参与了包括细胞外区域、细胞外区域分数、结构分子活性、分子功能调节因子、内质网和细胞外结构组织等通路(图9A)。KEGG分析显示了人乳头瘤病毒感染、ECM-受体相互作用、吞噬体、PI3K-Akt信号通路、WNT信号通路、PPAR信号通路和雌激素信号通路等术语的显著富集(图9B)。在线网站STRING用于研究风险组中差异表达基因的蛋白质相互作用,并生成了PPI网络(图S4A)。使用Cytoscape软件对PPI数据进行可视化处理,上调和下调基因的表达分别以红色和绿色标记(图9C)。然后使用Cytoscape的插件cytoHubba对差异表达基因中的中心基因进行筛选,排名前10位如图9D所示。随后比较了正常组织和肿瘤组织中中心基因的差异。结果显示,SPP1、COMP、THBS2、SERPINE1和COL11A1在肿瘤组织中高表达,而MYH11、TAGLN和CNN1低表达。预后价值分析显示,在上述八个具有统计学差异的中心基因中,只有SPP1、TAGLN、COMP、SERPINE1、COL11A1和CNN1的mRNA表达会影响预后(图9E-H),其中SPP1、COMP、SERPINE1和COL11A1的水平与不良预后具体相关。为了验证SPP1、COMP、SERPINE1和COL11A1在正常和CRC组织之间的差异表达,对11名CRC患者的正常和肿瘤活检标本进行了q-PCR检测(图9I-L)。

ae76cc9b77df4d73d9401efef83017a8.jpeg

图9 PPI网络的可视化


总结

本研究提供了一种新的、准确的预测CRC患者预后的方案。鉴于作者模型的显著预后能力和准确的治疗结果预测,作者的风险评分模型可以作为患者选择治疗的新工具。考虑到ERS在CRC中的重要性,有必要对其具体作用机制进行更深入的研究。

这篇关于4+内质网应激+预后模型教你如何应用到自己的生信分析研究中。的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/200334

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、