零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一)

2023-11-05 13:12

本文主要是介绍零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

经过一段时间的积累,搭建的分析平台已经日渐进入稳定的状态,很多粉丝也在和我们反馈,让我们出一下零代码生信套路课。

小编找了很久,发现某某机构出的TCGA联合GEO 免疫基因+代谢基因的生信套路,该套路应用常见相对来说比较广,又属于双热点套路。但是代码运行真的是太麻烦了,还有各种各样的报错,实在是不好弄,为此,我们推出了复现课程,该课程内容较长, 分成几篇进行讲解,如带来不便,请大家谅解!

一、TCGA数据的下载和预处理

这里通过生信豆芽菜官网可以直接下载TCGA的数据,比如这里我们以LUAD数据为例,

http://www.sxdyc.com/tcgaDataSet
在这里插入图片描述
下载后放在文件夹1.TCGA.pre下面
在这里插入图片描述
用excel打开TCGA.merge.cli.txthe tcga.merge.mRNA.TPM.txt的文件

1、整理表达谱数据
在这里插入图片描述
A列的数据为基因ENSG号,可以直接删掉,C列的数据需要注意,代表了基因的类型,比如说这里选择蛋白编码的基因,将其他类型的全部删掉
在这里插入图片描述
选择数据-筛选-将protein_coding的 基因保留下来,如果这里需要分析lncRNA,就单独只保留lncRNA
在这里插入图片描述
这时候,删掉A和C列的数据

将数据保存后,这里出来后的数据很容易出现重复的基因,所以可以使用我们的去重工具

http://www.sxdyc.com/singleCollectionTool?href-preprocess
在这里插入图片描述
选择去重工具,上传刚刚处理好的TCGA的表达谱数据,并选择去重的方法,等待运行结束即可。
在这里插入图片描述
当然如果文件过大,可以选择7-zip进行压缩,将文件压缩为.gz的格式

在这里插入图片描述
在这里插入图片描述
2、整理生存数据

打开文件后,先删掉后面无用的列名信息,去重
在这里插入图片描述
替换字符
在这里插入图片描述
去掉缺少生存时间和生存状态的样本
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
最后保存数据即可

二、GEO数据的下载和预处理

1、从NCBI的GEO dataset官网查找合适的GEO的数据集,可以通过关键词进行查找,也可以通过已经发表的文章进行筛选。

(https://www.ncbi.nlm.nih.gov/)
在这里插入图片描述
通过一些关键词进行搜索。

比如这里选择GSE31210,怎么下载呢
在这里插入图片描述
往下滑动,选择platforms(平台注释文件)和矩阵文件
在这里插入图片描述
在这里插入图片描述
2、表达谱数据和临床数据的处理

对GSE31210_series_matrix.txt.gz文件进行解压,然后excel打开
在这里插入图片描述
这一部分为样本的表型数据,有时候,表型的临床是存在原文的附件中。

表达谱的数据,这些信息都要删掉,同时拉到最后,将最后一行删掉。
在这里插入图片描述
然后保存一下数据
在这里插入图片描述
3、注释信息的准备

删掉多余的行和列,去掉一个探针对应多个基因名
在这里插入图片描述
选择筛选-包含-///,将这些行全部删掉。
在这里插入图片描述
在这里插入图片描述
合并数据
在这里插入图片描述
运行完成后
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在最后一列,有基因的名字,直接剪切粘贴到A列
在这里插入图片描述
这时候保存一下,再用去重工具,去一下重复的基因,在前面处理的时候,我们将一个探针对应多个基因的去掉了,那么这里的基因重复就是多个探针对应一个基因名,可以选择去重方法进行去重,这里就省略了
在这里插入图片描述
到这里数据的准备阶段基本就做完了,需要注意的是,在分析的过程中药注意基因的表达,相差大的,可以取一个log进行后续的分析。
#################################
到这里数据准备基本就结束,如果有兴趣可以关注公众号(豆芽数据分析)
有零代码复现相关问题,可以付费进入零代码答疑群和大家一起交流,群费为9.9元,拒绝白嫖党(添加微信:ShenxinBS003或者ShenxinBS001)

这篇关于零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/350091

相关文章

python实现pdf转word和excel的示例代码

《python实现pdf转word和excel的示例代码》本文主要介绍了python实现pdf转word和excel的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、引言二、python编程1,PDF转Word2,PDF转Excel三、前端页面效果展示总结一

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

Python结合requests和Cheerio处理网页内容的操作步骤

《Python结合requests和Cheerio处理网页内容的操作步骤》Python因其简洁明了的语法和强大的库支持,成为了编写爬虫程序的首选语言之一,requests库是Python中用于发送HT... 目录一、前言二、环境搭建三、requests库的基本使用四、Cheerio库的基本使用五、结合req

python多进程实现数据共享的示例代码

《python多进程实现数据共享的示例代码》本文介绍了Python中多进程实现数据共享的方法,包括使用multiprocessing模块和manager模块这两种方法,具有一定的参考价值,感兴趣的可以... 目录背景进程、进程创建进程间通信 进程间共享数据共享list实践背景 安卓ui自动化框架,使用的是

SpringBoot生成和操作PDF的代码详解

《SpringBoot生成和操作PDF的代码详解》本文主要介绍了在SpringBoot项目下,通过代码和操作步骤,详细的介绍了如何操作PDF,希望可以帮助到准备通过JAVA操作PDF的你,项目框架用的... 目录本文简介PDF文件简介代码实现PDF操作基于PDF模板生成,并下载完全基于代码生成,并保存合并P

SpringBoot基于MyBatis-Plus实现Lambda Query查询的示例代码

《SpringBoot基于MyBatis-Plus实现LambdaQuery查询的示例代码》MyBatis-Plus是MyBatis的增强工具,简化了数据库操作,并提高了开发效率,它提供了多种查询方... 目录引言基础环境配置依赖配置(Maven)application.yml 配置表结构设计demo_st

SpringCloud集成AlloyDB的示例代码

《SpringCloud集成AlloyDB的示例代码》AlloyDB是GoogleCloud提供的一种高度可扩展、强性能的关系型数据库服务,它兼容PostgreSQL,并提供了更快的查询性能... 目录1.AlloyDBjavascript是什么?AlloyDB 的工作原理2.搭建测试环境3.代码工程1.

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python

Java中ArrayList的8种浅拷贝方式示例代码

《Java中ArrayList的8种浅拷贝方式示例代码》:本文主要介绍Java中ArrayList的8种浅拷贝方式的相关资料,讲解了Java中ArrayList的浅拷贝概念,并详细分享了八种实现浅... 目录引言什么是浅拷贝?ArrayList 浅拷贝的重要性方法一:使用构造函数方法二:使用 addAll(