MIMIC-IV数据库中患者院内死亡的单因素生存分析

2023-10-29 22:11

本文主要是介绍MIMIC-IV数据库中患者院内死亡的单因素生存分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目的

由易到难,对mimic-iv的查询进行实际操作,体现先前文章中提到的mimic-iv数据查询的规律。

数据分析计划

死亡,是重症患者最重要的结局指标,在MIMIC数据库中收录了院内死亡的数据,以及进出ICU的时间(和进出医院的时间),所以我们可以获得是否死亡,以及从入ICU(或入院)到死亡发生之间的时间,有了这两个指标,我们可以通过Cox单因素(参数和非参数)模型来观察ICU(和医院)内死亡的趋势,以及某个变量(比如,性别和种族等)对死亡趋势的影响,以为后续的分析奠定基础。

数据的获取

我们需要数个变量,1. 从如入ICU(或入医院)到患者死亡的时间; 2. 患者是否发生院内死亡;3. 性别等;而这几个变量都存储在同一个表格中。

select * from `physionet-data.mimic_derived.icustay_detail`

体现先前文章中提到的几个原则:

  • 原则1,重视mimic-derived模块,即首先从这个模块中取寻找需要的变量;
  • 原则2,google cloud 上的mimic 数据库查询更方便。
  • 原则3,查询之前了解变量以及变量存储的表格。

数据分析的方法和结果

  1. mimic-iv下载表格的信息
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  0   subject_id            76540 non-null  int64  1   hadm_id               76540 non-null  int64  2   stay_id               76540 non-null  int64  3   gender                76540 non-null  object 4   dod                   13628 non-null  object 5   admittime             76540 non-null  object 6   dischtime             76540 non-null  object 7   los_hospital          76540 non-null  int64  8   admission_age         76540 non-null  int64  9   ethnicity             76540 non-null  object 10  hospital_expire_flag  76540 non-null  int64  11  hospstay_seq          76540 non-null  int64  12  first_hosp_stay       76540 non-null  bool   13  icu_intime            76540 non-null  object 14  icu_outtime           76540 non-null  object 15  los_icu               76540 non-null  float6416  icustay_seq           76540 non-null  int64  17  first_icu_stay        76540 non-null  bool 
  1. ICU 患者K-M曲线的结果, K-M生存曲线是最常见的非参数模型, 后续我们还可以用参数模型进行类似的估计,这里用的是python包lifelines。
    mimic-ivICU患者的K-M生存曲线
    解读:y轴代表患者在某个时间点生存的概率(我觉得这里理解成比率,是不是更好理解一些),x轴代表时间,可以看到随着时间的增加,患者生存的概率逐渐降低(死亡的风险增加),100天的时候生存概率已经到达一个较低的水平。

  2. 探索ICU患者性别对于生存函数的影响,首先分组制作K-M曲线图,然后进行log-tank检验,都是用lifelines包完成。
    在这里插入图片描述
    log-tank 检验的结果:
    test_statistic p -log2(p)
    18.88 <0.005 16.13

  3. 参数模型Weibull的拟合ICU患者数据的结果
    在这里插入图片描述
    结果解读:因为时间数据中有值为0,所以直接用会有提示错误,可以将为0的值替换为小的正值,比如0.1即可。左图累计曲线的与K-M曲线类似,但是更平滑, 有图为Q-Q图,显示与中央线不贴合,代表数据不符合Weibull分布,所以用Weibull模型进行拟合不合适,需要探索其它的模型,在此不多重复操作。

  4. 以上操作在院内患者数据中的分析结果
    在这里插入图片描述
    在这里插入图片描述
    test_statistic p -log2(p)
    26.77 <0.005 22.05

结果解读:院内死亡的时间跨度更长一些,男性和女性之间的生存率之间有统计学差异

这篇关于MIMIC-IV数据库中患者院内死亡的单因素生存分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/303684

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中, "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时,经常听到第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及 BCNF(Boyce-Codd范式)。这些范式都旨在通过消除数据冗余和异常来优化数据库结构。然而,当我们谈到 4NF(第四范式)时,事情变得更加复杂。本文将带你深入了解 多值依赖 和 4NF,帮助你在数据库设计中消除更高级别的异常。 什么是

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in

三相直流无刷电机(BLDC)控制算法实现:BLDC有感启动算法思路分析

一枚从事路径规划算法、运动控制算法、BLDC/FOC电机控制算法、工控、物联网工程师,爱吃土豆。如有需要技术交流或者需要方案帮助、需求:以下为联系方式—V 方案1:通过霍尔传感器IO中断触发换相 1.1 整体执行思路 霍尔传感器U、V、W三相通过IO+EXIT中断的方式进行霍尔传感器数据的读取。将IO口配置为上升沿+下降沿中断触发的方式。当霍尔传感器信号发生发生信号的变化就会触发中断在中断