WGCNA如何挖掘潜在的共表达基因

2023-11-02 08:50

本文主要是介绍WGCNA如何挖掘潜在的共表达基因,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注微信公众号《生信修炼手册》!

共表达基因指的是表达量具有协同变化趋势的基因集合,通常认为这些基因参与相同的生物学过程,比如参与同一个代谢通路,正是由于功能上的协同作用,导致表达量呈现出高度相关性。

在WGCNA中,对传统的相关系数进行乘方运算,用最终得到的值来表征基因间的相关性。在计算出这样的相关性统计量值之后,如何确定哪些基因是共表达的呢?

WGCNA的做法是聚类分析,聚类分析属于一种非监督的机器学习算法,通过聚类树,可以观察到哪些基因在聚类树中属于同一分支,属于同一分支的基因可以归为一类。实际操作中,考虑到基因数目较多等情况,肯定需要算法来自动化的进行分类,WGCNA采用的是dynamicTreeCut这个R包。

对于聚类算法而言,需要输入基因间的距离矩阵,首先就需要将基因间的邻接矩阵转换为距离矩阵,对相关系数进行乘方运算,可以计算出邻接矩阵,但是这个值本质上反映的是基因间的相似度,并不是距离。在计算距离矩阵时,WGCNA采用了TOM这种统计量,该统计量可以表征网络中节点的相似性,计算公式如下
在这里插入图片描述
对于两个基因ij而言,a表示两个基因邻接矩阵中对应的值,就是相关系数的乘方,K代表的每个基因的连接度, 公式如下

这篇关于WGCNA如何挖掘潜在的共表达基因的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/329470

相关文章

临床基础两手抓!这个12+神经网络模型太贪了,免疫治疗预测、通路重要性、基因重要性、通路交互作用性全部拿下!

生信碱移 IRnet介绍 用于预测病人免疫治疗反应类型的生物过程嵌入神经网络,提供通路、通路交互、基因重要性的多重可解释性评估。 临床实践中常常遇到许多复杂的问题,常见的两种是: 二分类或多分类:预测患者对治疗有无耐受(二分类)、判断患者的疾病分级(多分类); 连续数值的预测:预测癌症病人的风险、预测患者的白细胞数值水平; 尽管传统的机器学习提供了高效的建模预测与初步的特征重

bedtools subtract 基因区段取差集

基本概述: bedtools subtract 通俗的说,得到 A - B 的区段。如果在A中发现了B区段,就把 B 扣除,通过不同的参数,扣除的标准不一样。其中,参数 -A 可以达成 Remove features with any overlap 的效果(第四行)。 使用方法: bedtools subtract [OPTIONS] -a <BED/GFF/VCF> -b <BE

解决解压缩时的错误提示 “无法成功完成操作, 因为文件包含病毒或者潜在垃圾文件“

近期, 有一些朋友反馈在解压zip压缩包, 或者在安装软件的过程中出现了下面的错误提示: "无法成功完成操作, 因为文件包含病毒或者潜在垃圾文件" "Operation did not complete successfully because the file contains a virus or potentially unwanted software" 上述错误一般

【佳学基因检测】网站加密证书失效后,如何移除并为新的证书安装准备环境?

【佳学基因检测】网站加密证书失效后,如何移除并为新的证书安装准备环境? 当WoTrus DV Server CA证书失效后,你需要确保你的Nginx配置中不再引用该证书,并且移除或替换相关的证书文件。以下是具体步骤: 1. 确认Nginx配置文件 首先,检查Nginx的配置文件,确保它不再引用旧的WoTrus证书。如果你已经使用Certbot安装了Let’s Encrypt证书,Certbo

外泌体相关基因肝癌临床模型预测——2-3分纯生信文章复现——5.拷贝数变异及突变图谱(2)

内容如下: 1.外泌体和肝癌TCGA数据下载 2.数据格式整理 3.差异表达基因筛选 4.预后相关外泌体基因确定 5.拷贝数变异及突变图谱 6.外泌体基因功能注释 7.LASSO回归筛选外泌体预后模型 8.预后模型验证 9.预后模型鲁棒性分析 10.独立预后因素分析及与临床的相关性分析 11.列线图,ROC曲线,校准曲线,DCA曲线 12.外部数据集验证 13.外泌

在线绘制哑铃图(dumbbell chart)展示基因拷贝数变异(CNV)

导读: 哑铃图的名称来源于其形状,它看起来像一个哑铃,有两个圆形的“重量”在两端,通过一根“杆”连接。常用于展示两个或多个数据集之间的差异。本文介绍了如何使用哑铃图展示基因的拷贝数变异。 Journal of Translational Medicine文章《SLC26A4 correlates with homologous recombination deficiency and pa

《Hadoop大数据分析与挖掘实践》基础篇笔记(1~6章)

数据挖掘的基本任务: 包括利用分类与预测、聚类分析、关联规则、包括利用分类与预测、聚类分析、关联规则、 时序模式、偏差检测、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业竞争力。 数据挖掘建模过程:     1. 目标定义         任务理解         指标确定     2. 数据采集         建模抽样:数据采样的相关性,可靠性,有效性

从客户端(content1=quot;lt;img src=quot;/web/news/...quot;)中检测到有潜在危险的 Request.Form 值。

kindeditor 一开始一直不能上传图片 配置了所有应该配置的参数,从网上找各种大神贴,依旧不行,本来都是测试成功的不知道问啥突然就不能上传图片,蓝瘦香菇一阵后决定重新下载安装配置,整了一波后终于ok,但是又出现新的问题 提交不成功,一直提示: 从客户端(content1="<img src="/web/news/…")中检测到有潜在危险的 Request.Form 值。 加上配置文件中

NLP07:基于潜在隐语义索引的文本相似度计算

1.潜在隐语义索引(LSI)概述 潜在语义索引(Latent Semantic Indexing,以下简称LSI),有的文章也叫Latent Semantic Analysis(LSA)。其实是一个东西,后面我们统称LSI,它是一种简单实用的主题模型。LSI是基于奇异值分解(SVD)的方法来得到文本的主题的。 这里我们简要回顾下SVD:对于一个 m × n m \times n m×n的矩阵

基因敲除小鼠技术

转基因、基因敲入/敲除动物技术已经成为现代生命科学基础研究和药物研发领域不可或缺的重要技术,该技术从上世纪七八十年代诞生以来,至今已有近四十年的历史,经典技术如DNA原核显微注射、胚胎干细胞显微注射技术一直以来经久不衰,在小鼠模型构建方面日趋完善,并且如同剪切酶和抗体等常规分子生物学试剂的制备技术一样,逐渐从基础研究实验室转向商业模式,成为一项高度标准化的新兴产业,催生了数以百计的创新药