本文主要是介绍影像组学下(Radiomic)的生存分析基本概念及统计分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
旨在对生存分析有个直观认识(做什么,怎么做),每一步的详细的内容后续补充,不懂得百度英文资料。主要参考方积乾老师的“生物医学研究的统计方法”
生存分析是将重点时间的出现与否和出现终点事件所经历的时间结合起来分析的一类统计学分析方法。可用于生存率估计,生存曲线比较,影响因素分析和生存预测。
生存分析方法建立在对生存时间排序的基础上,精细的时间单位准确率较高(日>月>年)
认真随访
DFS,无病生存期,从随机化开始至复发或由于疾病进展导致死亡的时间。
PFS,无进展生存期,从随机化开始到肿瘤恶化或死亡的时间,二者发生其一,则到达研究终点。
OS,总生存期。
删失(censored data): 随访结束时,未发生终点事件或者不知道确切的生存时间(失访)的数据,患者死于其他原因也算是删失。一般删失记为0,终点事件(要研究的事件,如复发、转移、死亡)记为1.
生存概率(probability of survival):单位时间开始存活的个体数量,到该时段结束时仍然存活的可能性。
P(年生存概率)= 某年活满一年的人数 / 某年年初的人口数
生存率(survival rate): 指观察对象经历t个单位时间段后仍存活的可能性。
用K-M曲线估计生存率:根据某一特征将数据分为两组,根据两条生存曲线的中位生存期(生存曲线纵轴生存率为50%时对应横轴生存时间)来大致的判断两组数据对终点事件的影响程度,详细的评判需要下面的假设检验。
如何比较生存曲线?两组生存率差别有无统计学意义?——需要通过假设检验来回答。
常用的有log-rank和Wilcoxon(Breslow)检验,这两种检验能充分利用生存时间(包括删失数据),而且能对各组的生存率作整体比较。前者对组间终点事件的发生远期差异敏感,后者对组间终点事件发生的近期差异敏感。一般用log-rank。
如何分析影响因素(各个特征)对患者生存时间的影响?——Cox比例风险回归模型
通俗的讲,就是我们已经知道了生存分析(K-M曲线),是随着时间的流逝,死亡率是如何增加的。那么如何根据某些因子把样本分组,看到他们死亡率的变化趋势显著的不同,从而说明这个因子是非常有效的分类方式,这个因子可以是一个biomarker呢?就是用COX模型了。
该模型以生存结局和生存时间为因变量,可同时分析多因素对生存期的影响,分析带有删失生存时间的资料,且不要求估计资料的生存分布类型!
多因素Cox回归分析可以在其他因素不变的情况下,考察某个或某些因素对生存的影响,具体包括:
1、 影响因素分析:其他影响因素(特征)不变的情况下,某一个特征对终点事件的影响; 通过标准化回归系数评价所有因素的影响大小。
2、 校正混杂因素后的组间比较(暂时不懂)
3、 多因素生存预测(重要):用Cox回归分析的结果,可以得到每个特征的系数,进而得到风险函数h(t)的表达式。指数部分也叫做PI(预后指数 prognostic index),取值越大,预后越差。医学分析上,常根据PI将观察对象分为高低风险组,以考察不同组(即不同PI)对生存率的影响。
这篇关于影像组学下(Radiomic)的生存分析基本概念及统计分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!