本文主要是介绍代谢组数据分析(十九):随机森林构建代谢组预后模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
介绍
建立胃癌(GC)预后模型时,从队列3中的181名患者中,使用右删失结果数据进行了随机分层抽样,分为训练数据集(n = 121)和测试数据集(n = 60)。训练了一个包含1000棵树的随机生存森林(RSF)模型,根据它们基于排列的特征重要性来选择突出的特征。通过再次训练随机生存模型,并选取28种代谢物,建立了显示出色预测能力(AUROC = 0.832,95% CI:0.697-0.951)的最佳模型,用于预测测试数据集中GC患者的生存结果。
此外,还利用单变量Cox回归分析中与患者结果显著相关的临床特征,包括TNM分期、宏观表现和血管肿瘤栓塞,分别或组合训练RSF模型。还拟合了综合RSF模型(28种代谢物特征与临床参数结合),以预测患者的结果。通过C指数在测试数据集上评估了模型性能。
对于个体结果预测,样本在森林中的每棵树上都按照对数秩检验的分裂标准下降,直到到达一个终端节点。每个终端节点中的数据用于非参数地估计生存和累积危险函数,分别使用Kaplan-Mei
这篇关于代谢组数据分析(十九):随机森林构建代谢组预后模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!