生存分析survival_analysis_COXmodel_python实现

2023-12-28 22:04

本文主要是介绍生存分析survival_analysis_COXmodel_python实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是生存分析?

生存分析(在工程中也称为可靠性分析)的目标是建立协变量与事件发生时间之间的联系。该算法起源于临床医学研究,往往主要目标是预测死亡时间,即生存。生存分析时一种回归问题(人们想要预测一个连续的值),它与传统回归的不同之处在于,部分训练数据只能被部分观察到(它们被删减了)。

例如:
考虑一项临床研究,该研究调查了冠心病,时间跨度为1年。如图所示。
在这里插入图片描述

患者A在3个月后失去随访,无心血管事件记录,患者B在入组4个半月后发生事件,患者D在入组2个月后退出研究,患者E在研究结束前未发生任何事件。因此,只能记录患者B和C的心血管事件的确切时间,他们的记录是未删失的。对于剩余的患者,不知道他们是否在研究结束后是否发生了事件,因此他们的信息是删失的。

形式上,每个患者记录由一组协变量组成 x ∈ R d x \in \mathbb{R}^d xRd,以及时间 t > 0 t>0 t>0事件发生的时间或时间 c > 0 c>0 c>0删失。由于删失、经历和事件是相互排斥的,所以通常定义一个事件指示器 δ ∈ { 0 ; 1 } \delta \in \{0;1\} δ{0;1}以及可观察到的生存时间 y > 0 y>0 y>0。右删失样本可观测时间 y y y的定义为
y = m i n ( t , c ) = { t if  δ = 1 c if  δ = 0 y=min(t,c)=\begin{cases} t& \text{ if } \delta =1 \\ c& \text{ if } \delta =0 \end{cases} y=min(t,c)={tc if δ=1 if δ=0
因此,生存分析是一种需要考虑到这种数据集的独特特征的算法。

生存分析的研究对象为生存时间,即事件失败所发生的时间,比如研究病人感染某种病毒之后多长时间会死亡,也可以是借款者在完成借款后多长时间会发生违约事件。

生存分析中的预测通常侧重与预测一个函数,而不是专注于预测时间上发生的事件,要么是生存函数,要么是风险函数。

生存函数 S ( t ) = P ( T > t ) S(t)=P(T>t) S(t)=P(T>t)返回超过时间 t t t的生存概率,风险函数 h ( t ) h(t) h(t)表示事件在小时间间隔 [ t ; t + △ t ] [t; t+\triangle t] [t;t+t]内事件发生的近似概率(没有上界),条件是个体在时间 t t t时没有发生事件:
h ( t ) = lim ⁡ △ t → 0 P ( t ≤ T < t + △ t ∣ T ≥ t ) △ t ≥ 0 h(t)=\lim_{\triangle t \to 0} \frac{P(t\le T < {t+\triangle t}|T \ge t)}{\triangle t} \ge 0 h(t)=t0limtP(tT<t+tTt)0

风险函数的其他名称有条件失败率、条件死亡率或瞬时失败率。与描述事件未发生的生存函数不同,风险函数提供了关于事件发生的信息。累计风险函数 H ( t ) H(t) H(t)为时间段 [ 0 ; t ] [0;t] [0;t]内风险函数的积分:
H ( t ) = ∫ 0 t h ( u ) d u H(t)=\int_0^t h(u)du H(t)=0th(u)du

预测

给定观察数据 { ( y 1 , δ 1 ) , . . . , ( y n , δ n ) } \{(y_1,\delta_1),...,(y_n,\delta_n)\} {(y1,δ1),...,(yn,δn)},生存函数 S ( t ) S(t) S(t) H ( t ) H(t) H(t)可以分别通过sksurv.nonparametric.kaplan_meier_estimator()sksurv.nonparametric.nelson_aalen_estimator()估计。

上述估计过于简单,因为没有考虑到可能影响生存的其他特征。 C O X COX COX比例风险模型(sksurv.linear_model.CoxPHSurvivalAnalysis)提供了一种在存在额外协变量情况下估计生存和累计风险函数的方法,它假设存在基线风险函数,并且协变量仅按比例改变风险。也就是说,它假设两个病人经历一个事件的风险比率随时间保持不变。生存函数 S ( t ) S(t) S(t) H ( t ) H(t) H(t)可以分别通过sksurv.linear_model.CoxPHSurvivalAnalysis.predict_survival_function()sksurv.linear_model.CoxPHSurvivalAnalysis.predict_cumulative_hazard_function()估计。

这篇关于生存分析survival_analysis_COXmodel_python实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/547445

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Python脚本实现自动删除C盘临时文件夹

《Python脚本实现自动删除C盘临时文件夹》在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧... 目录一、准备工作二、python脚本编写三、脚本解析四、运行脚本五、案例演示六、注意事项七、总结在日常使用

Java实现Excel与HTML互转

《Java实现Excel与HTML互转》Excel是一种电子表格格式,而HTM则是一种用于创建网页的标记语言,虽然两者在用途上存在差异,但有时我们需要将数据从一种格式转换为另一种格式,下面我们就来看看... Excel是一种电子表格格式,广泛用于数据处理和分析,而HTM则是一种用于创建网页的标记语言。虽然两

Java中Springboot集成Kafka实现消息发送和接收功能

《Java中Springboot集成Kafka实现消息发送和接收功能》Kafka是一个高吞吐量的分布式发布-订阅消息系统,主要用于处理大规模数据流,它由生产者、消费者、主题、分区和代理等组件构成,Ka... 目录一、Kafka 简介二、Kafka 功能三、POM依赖四、配置文件五、生产者六、消费者一、Kaf

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

使用Python实现在Word中添加或删除超链接

《使用Python实现在Word中添加或删除超链接》在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能,本文将为大家介绍一下Python如何实现在Word中添加或... 在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能。通过添加超

windos server2022里的DFS配置的实现

《windosserver2022里的DFS配置的实现》DFS是WindowsServer操作系统提供的一种功能,用于在多台服务器上集中管理共享文件夹和文件的分布式存储解决方案,本文就来介绍一下wi... 目录什么是DFS?优势:应用场景:DFS配置步骤什么是DFS?DFS指的是分布式文件系统(Distr

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服