大数据分析Project-胰腺癌病人模型预测01

2023-11-01 17:50

本文主要是介绍大数据分析Project-胰腺癌病人模型预测01,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Project 第一部分 数据处理

导入数据

> mydata <- read.csv("/users/xinyiwang/study/Rproject9/E6.csv")

查看数据中有缺失值的行

> mydata[!complete.cases(mydata),]id alb  rdw pla  tg       NLR gender age death      hs ventilation
13  1230112 2.2 13.2 188  92        NA      0  81  1.00  2.7699           0
62   122031 2.2 12.8  NA  81 33.000000     NA  76  1.00  2.6600           0
77   103111  NA 17.2 231  NA  9.333000      0  73  1.00  1.2220           0
91  5100022 3.3 12.9 312 199 13.799000     NA  73  0.00 11.3330           1
124  663111  NA 16.1  99  NA  6.111100      1  72  1.00  3.0001           1
144  271110 2.5 13.6 118  NA  2.811110      0  70  0.00  3.2221           0
197  407661 4.1 12.5 288  81        NA      0  65  1.00 12.0112           0
245  409911 3.8 12.9 178  NA  4.550100      1  61  0.00 18.2210           0
277  230110 2.9 16.0  NA 132  1.200000      0  58  1.00  2.3300           1
297  391110 2.8 15.9  NA 202 10.666552      1  55  1.00  7.6600           1
323  319911 2.9 16.3 312  NA  4.550011      1  53  1.00 14.3331           1
357 3001112 3.8 12.9 112  NA  1.234100      1  50  0.00  3.1220           0
401 2100111 4.1 15.8  30  NA  3.999900      0  47  1.00  2.0111           1
448 1002222  NA 12.2  NA  NA        NA     NA  42  1.00  2.1100           0
449  200111 2.8 12.9  NA 201  3.220000      1  42  0.00  3.4445           1
484 2010111 3.1 13.1 322  NA  2.400000      1  39  1.00  2.1110           0
517  120331 3.3 17.9 188 209        NA      1  34  0.00  1.2230           1
541  311199 3.2 14.5  45 123  1.222000     NA   1  3.21  1.0000          NA

判断数据中有缺失值的行数,还有缺失值的数目

> missingdf <- mydata[!complete.cases(mydata),]
> nrow(missingdf)
[1] 18
> sum(is.na(mydata))
[1] 26

生成一个展示缺失值的表格

> library(mice)
> md.pattern(mydata)id rdw age death hs ventilation alb NLR gender pla tg   
537  1   1   1     1  1           1   1   1      1   1  1  0
6    1   1   1     1  1           1   1   1      1   1  0  1
3    1   1   1     1  1           1   1   1      1   0  1  1
1    1   1   1     1  1           1   1   1      0   1  1  1
1    1   1   1     1  1           1   1   1      0   0  1  2
3    1   1   1     1  1           1   1   0      1   1  1  1
2    1   1   1     1  1           1   0   1      1   1  0  2
1    1   1   1     1  1           1   0   0      0   0  0  5
1    1   1   1     1  1           0   1   1      0   1  1  20   0   0     0  0           1   3   4      4   5  9 26

确实行数和缺失值相比于原始数据来说不是很多,因此先采用过滤所有有缺失行的数据

> newdata1 = mydata[complete.cases(mydata),]

此时还剩下537行数据

 

 

 

 

 

 

 

 

 

 

 

这篇关于大数据分析Project-胰腺癌病人模型预测01的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/324705

相关文章

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee

DeepSeek模型本地部署的详细教程

《DeepSeek模型本地部署的详细教程》DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私,在本地成功部署DeepSe... 目录一、环境准备(一)硬件需求(二)软件依赖二、安装Ollama三、下载并部署DeepSeek模型选

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt