脂质代谢+预后模型+WGCNA+单细胞多种要素分析

2023-10-13 03:28

本文主要是介绍脂质代谢+预后模型+WGCNA+单细胞多种要素分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天给同学们分享一篇脂质代谢+预后模型+WGCNA+单细胞的生信文章“A Novel Lipid Metabolism and Endoplasmic Reticulum Stress-Related Risk Model for Predicting Immune Infiltration and Prognosis in Colorectal Cancer”,这篇文章于2023年9月8日发表在Int Mol Sci期刊上,影响因子为5.6。
768cf968e0177b0fad007fc03e968440.jpeg

大肠癌(CRC)已成为第三大常见癌症和第二大癌症相关死亡原因[1]。不幸的是,约 20% 的 CRC 病例在确诊时已有转移[ 2]。由于手术方法、抗肿瘤药物和其他卓越治疗策略的进步,CRC 患者的临床治疗效果明显改善[3]。与传统化疗和靶向治疗相比,免疫疗法具有多种优势,包括持久的免疫反应、较少的副作用以及延长 DNA 错配修复缺陷或微卫星不稳定的转移性 CRC 患者的无进展生存期[4, 5]。然而,其中一些患者很快就会进入免疫抵抗阶段[6]。


1.探索 CRC 中差异表达的 LERGs

使用 "limma "R软件包鉴定差异基因,选择标准为p值< 0.05 and |FoldChange| > 1.5(|log 2 FoldChange| > 0.585)[ 25]。结果发现了 4940 个在 CRC 发展过程中表现出差异表达的关键基因,包括 2325 个上调基因和 2615 个下调基因(图 1A)。从 ER 应激和脂质代谢基因集中提取相关性得分大于 5 的基因,并与差异基因进行交叉,得到 271 个交叉基因(图 1B)。随后,Cox 比例-危害模型确定了 28 个对预后有意义的基因(p 值小于 0.05)(图 1C)。图1 基于差异表达的 LEGRs 构建预后特征

c94c03bcc2d6d6008ca0889f892739df.jpeg

图1 基于差异表达的 LEGRs 构建预后特征


2.预后模型的构建

为了进一步确定预后基因集中的关键基因,作者收集了 CRC 患者的临床信息,并利用 lasso 回归筛选特征基因(图 1D-F)。TCGA 中的患者按 4:1 的比例随机分配到训练数据集和测试数据集。该风险模型用于预测肿瘤内的 ER 应激和脂质代谢水平。根据每个样本的中位风险评分,将患者分为高风险组和低风险组,并使用 Kaplan-Meier 曲线分析生存结果。在TCGA训练数据集(p < 0.001)和测试数据集(p = 0.016)中,高风险组的总生存期(OS)明显低于低风险组。此外,TCGA训练数据集和测试数据集的ROC曲线结果表明该模型具有良好的预测性能(图2A,B)。

5302cafd64445ae7058d7e91c18d1b35.jpeg

图2 评估风险模型预测患者生存率的效率


3.多个外部数据集对预后模型的验证

从 GEO 数据库中下载了 CRC 患者的生存信息数据(GSE12945、GSE17536)。根据中位风险评分,将验证数据集中的患者分为高风险组和低风险组进行生存分析。结果显示,在外部验证数据集GSE12945(p = 0.002)和GSE17536(p = 0.042)中,高风险组的生存率明显低于低风险组。为了验证模型的准确性,作者使用外部数据集对该模型进行了 ROC 曲线分析。结果表明,该模型对 CRC 患者的预后具有很强的预测性能和稳定性(图 2C,D)。


4.发病风险和独立预后分析

通过单变量分析(HR = 3.628 (2.687-4.898),p < 0.001)和多变量分析(HR = 3.006 (2.129-4.244),p < 0.001),发现风险评分是 CRC 患者的独立预后因素(图 3A、B)。结果以提名图的形式呈现(图 3C)。此外,还对 CRC 的 3 年期和 5 年期进行了预测分析,结果显示提名图具有很强的验证性能和预测准确性(图 3D-F)。

8de8b365c619cdc7885477a5995fd4e3.jpeg

图3 构建评估患者生存期的预测提名图


5.疾病风险评分与多个临床指标的相关性分析

根据临床指标,将样本相关风险评分值分配到不同组别。经 Wilcoxon 检验发现,在临床指标(如分期、T、M 和 N)中,风险分值的分布显示出显著的组间差异(P < 0.05)(图 4)。这些结果表明,所构建的风险评分模型在显示 CRC 样本的分类方面具有良好的临床适用性。

58e99cb6dede741af332bdbfc3c570ee.jpeg

图4 风险评分与多个临床指标的相关性


6.CRC 的突变情况和肿瘤突变负荷 (TMB)

研究还进一步探讨了高风险组和低风险组患者的基因突变情况。研究结果表明,与低风险组相比,高风险组患者APC等基因的突变率明显较低(76% vs. 82%),而TP53和APC基因的突变率似乎高于低风险组(图5A,B)。随后进行了生存分析,将TMB和微卫星不稳定性(MSI)与风险评分相关联,结果见相应的图(图5C,D)。

3bfa8dac686cb8975745a0f36f8b7113.jpeg

图5 图表格式相同


7.风险模型的药物敏感性和分子途径

手术治疗联合化疗已被证明对早期 CRC 有效。作者的研究结果表明,风险评分与对16种特定化疗药物的敏感性之间存在明显的相关性。低风险组患者对丝裂霉素 C、吉西他滨、AKT 抑制剂 VIII 和 Tipifarnib 的敏感性较高。另一方面,高风险组患者对多西他赛、吉非替尼、帕佐帕尼和雷帕霉素的敏感性更高(图 6A)。随后的分析侧重于特定的信号通路,以探索风险评分影响肿瘤进展的潜在分子机制。GSVA分析显示,两个患者队列之间的主要分歧通路主要存在于肌生成、表皮间质转换和髓鞘连接信号通路中(图6B)。GSEA分析显示,PI3K-Akt和Rap1信号通路在高风险组明显富集,而核苷酸代谢通路在低风险组富集(图6C)。

1f970c0cd63b451b9541cf58e1e90622.jpeg

图6 风险模型的药物敏感性和分子途径


8.风险模型与免疫微环境之间的关系

TME主要由癌症相关成纤维细胞、免疫细胞、细胞外基质以及各种信号、分子和癌细胞组成,对肿瘤的诊断、预后和治疗敏感性有重要影响[27]。本研究进一步探讨了风险模型与 TME 中免疫浸润之间的关系。与不同风险组的免疫浸润相比,本研究发现高风险组的 T 细胞 CD4 +&nbsp;记忆静息和 T 细胞 CD4 +&nbsp;记忆激活明显减少。相反,天真 B 细胞、调节性 T 细胞(Tregs)和 M0 巨噬细胞则明显增加(图 7A)。风险评分与免疫细胞含量之间的相关性分析强调了与 M0 巨噬细胞和幼稚 B 细胞的显著正相关性,以及与静息和活化记忆 CD4 + T 细胞的负相关性(图 7B)。T 细胞呈负相关(图 7B)。此外,脂质代谢/ER 应激基因组与免疫浸润之间的相关性也通过 ssGSEA 得到了说明。肿瘤样本中的 M2 巨噬细胞和幼稚 B 细胞与脂质代谢/ER 应激水平呈正相关。相反,NK 细胞和 CD8 + T 细胞则显示出负相关。T细胞呈负相关(图7D)。这表明,在脂质代谢/ER应激水平升高的情况下,TME主要表现出免疫抑制表型,这与作者的风险模型的免疫浸润分析一致。作者对免疫调节基因进行了进一步分析,结果显示了高风险组和低风险组之间免疫相关抑制因子和细胞因子的表达差异(图 7E,F)。最后,对肿瘤免疫疗法的敏感性进行了预测,结果显示高风险组对免疫疗法的反应较差(图 7C)。

975046e988e7d75e720123c4aa734e32.jpeg

图7 低风险组和高风险组之间不同的免疫景观


9.构建 WGCNA 共表达网络并分析关键基因的上游机制

为了进一步确定与结直肠癌相关的关键基因,作者根据结直肠癌转录组采用了 WGCNA 来阐明相关的共表达调控网络[28]。软阈值 β 设为 6(图 8A,B),通过 TOM 共鉴定出 8 个基因模块(图 8C,D)。这些模块包括黑色(99)、蓝色(1052)、棕色(610)、绿色(454)、灰色(569)、红色(176)、绿松石色(1572)和黄色(468)模块。棕色模块的相关性最高(cor = 0.49,p = (5 × 10&nbsp;−37 )。将棕色模块中的基因与 18 个模型基因交叉后,确定了 6 个基因作为进一步研究的关键候选基因(图 8E),即 MMP3、SPP1、APOE、CAV1、TIMP1 和 AGRN。随后的 PPI 网络分析显示了这些关键基因之间的相互作用(图 8F)。还对关键基因的上游转录因子(TF)进行了分析。结果表明,MOTIF注释 cisbp_M5419 的 NES 为 4.9,三个关键基因富集在这一主题中。图 8G 中显示了与关键基因相关的前六个主题及其相应的 TF。

e653df897d2ef8b5ea062997edb00e4c.jpeg

图8 WGCNA 共表达网络的构建及关键基因的上游机制分析


10.在 CRC 临床样本中验证关键基因

最后,作者利用定量实时聚合酶链反应qRT-PCR和HPA数据库中的病理切片图像对12对临床样本的基因表达进行了探讨(图9A-E)。在这六个中心基因中,与正常组织相比,AGRN、SPP1、MMP3 和 TIMP1 在 CRC 组织中的表达明显升高。此外,CAV1 在 RNA 和蛋白水平上的表达都明显下降。虽然 APOE 在 qRT-PCR 中未显示出明显变化,但蛋白水平却显示出下降趋势,这与 TCGA 分析结果一致。

a83b9f1eccdf785078d7b4b230aeef9d.jpeg

图9 验证 CRC 临床样本中的关键基因


11.CRC 免疫格局和基因表达的单细胞分析

使用 t-SNE 算法对细胞进行聚类,最终确定了 17 个亚型(图 10A)。利用 R 软件包 "SingleR "对每个亚型进行注释,17 个聚类属于 9 个细胞类别:T细胞、B细胞、上皮细胞、单核细胞、中性粒细胞、组织干细胞、巨噬细胞、NK细胞和内皮细胞(图10B)。六种中心基因在这九种细胞类型中的表达情况直观可见(图 10G)。研究发现,在高风险组和低风险组中,这些细胞亚型之间存在着错综复杂的相互作用模式。研究发现,在两个风险组中,巨噬细胞与其他细胞的潜在相互作用最多(图 10C、D)。随后,利用 GeneCards 数据库获得了失败评分和细胞因子评分,并对高风险组和低风险组进行了比较。分析结果如图所示(图 10E、F)。

f91f18ce041a79b794501267faab9221.jpeg

图10 免疫图谱的单细胞分析


总结

总之,作者发现了 18 个与脂质代谢和 ER 应激相关的差异表达基因,并利用这些基因构建了一个风险模型。作者的风险模型与 CRC 患者的总生存期、抗肿瘤治疗效果和免疫浸润相关。这揭示了ER应激和脂质代谢水平的升高与CRC的免疫抑制状况和不良预后相关,为精准治疗提供了战略性启示。通过探索脂质代谢和ER应激的新方向,这项研究可以帮助制定个性化治疗策略,并为进一步研究CRC的免疫微环境奠定重要基础。

这篇关于脂质代谢+预后模型+WGCNA+单细胞多种要素分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/200438

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者