R语言绘制动态网络图Network教程WGCNA

2024-04-23 07:12

本文主要是介绍R语言绘制动态网络图Network教程WGCNA,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天分享的笔记是使用NetworkD3对WGCNA的共表达网络进行可视化,创建交互式动态网络图,展示基因之间的相互关系,可以用于转录组或者其他调控网络展示。

加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。

alt

例如上图展示特异性模块内的基因共表达网络,点的大小和深浅代表该基因在网络中连通性的高低。转录因子用三角形表示, 其他基因用圆形表示。

如何绘制动态网络图?

首先,加载R包和数据,所用到的数据是WGCNA分析得到的输出网络文件,格式是Cytoscape的输入格式,本文的示例数据已上传,留言区回复邮箱,系统自动发送示例数据和全部代码。

library(networkD3)
library(tidyverse)
library(vroom)

df_node <- vroom::vroom("CytoscapeInput-nodes-black.txt")
df_edge <- vroom::vroom("CytoscapeInput-edges-black.txt")

> head(df_node)
# A tibble: 6 × 3
  nodeName  altName   `nodeAttr[nodesPresent, ]`
  <chr>     <chr>     <chr>                     
1 AT1G01010 AT1G01010 black                     
2 AT1G01090 AT1G01090 black                     
3 AT1G01180 AT1G01180 black                     
                  
> head(df_edge)
# A tibble: 6 × 6
  fromNode  toNode    weight direction  fromAltName toAltName
  <chr>     <chr>      <dbl> <chr>      <chr>       <chr>    
1 AT1G69920 AT1G71030  0.445 undirected AT1G69920   AT1G71030
2 AT1G15125 AT1G71030  0.440 undirected AT1G15125   AT1G71030
3 AT1G02920 AT1G71030  0.438 undirected AT1G02920   AT1G71030

df_node文件保存节点信息,df_edge保存边的信息,包括起始位置和结束为止,以及连线的权重大小。这里每个节点可以表示一个基因,节点之间的weight权重值用来表示两个基因之间的关联性。

数据的过滤与筛选

df_edge <- df_edge %>% arrange(-weight) %>% head(100)
# 删除自身和自身相关位点
df_edge <- df_edge[which(df_edge$fromNode != df_edge$toNode),]
networkData <- df_edge[1:2]
simpleNetwork(networkData,linkDistance = 100)

由于基因数量比较多,因此这里先按照权重值进行排序,然后选取前100行,这一步可以根据你的需要设置,也可以按照制定阈值过滤,然后绘制一张简单版本的网络图:

alt

格式转换与重新编码

alt

由于我们WGCNA输出的文件中节点都是通过基因ID来表示,但是绘图时无法直接识别节点ID,需要修改为数字0、1、2...因此,需要对节点进行重新修改。

# 转换格式
df_edge_net <- df_edge[,c(1,2,3)] %>% as.data.frame()
df_node_net <- df_node[,c(1,3)] %>% as.data.frame()

colnames(df_edge_net) <- c("source" ,"target" ,"value")
colnames(df_node_net) <- c("name","group")

# 合并第一列和第二列,并取并集
merged_elements <- union_all(df_edge_net$source,df_edge_net$target) %>% unique()

# 对合并后的元素进行编号
element_numbers <- seq_along(merged_elements)

# 创建一个新的数据框,包含合并的元素和对应的编号
result_df <- data.frame(merged_elements, element_numbers)
result_df$element_numbers <- result_df$element_numbers-1

# 使用映射表更新原始数据框的第一列和第二列
df_edge_net$source <- result_df$element_numbers[match(df_edge_net$source, result_df$merged_elements)]
df_edge_net$target <- result_df$element_numbers[match(df_edge_net$target, result_df$merged_elements)]

经过这一步处理后能够得到两个新的数据框,这就是绘制动态网络图的关键输入数据。在此基础上,我们还可以添加一些额外的信息,比如按照不同的分组将节点赋予不同的颜色,或者根据根据基因之间的正调控和负调控设置连接线的颜色。

# 生成模拟数据
df_edge_net$value <- c(runif(nrow(df_edge_net)/2,0,1),runif(nrow(df_edge_net)/2,0,5))
df_edge_net$color <- c(rep("red",50),rep("green",50))

value值表示节点之间连线的权重大小,可以用来展示两个基因之间的关联程度,该值越大线越粗,关联性越强。

color值可以用来设置连线的颜色,比如设置正调控为红色,负调控为绿色。

除了设置节点与节点之间边的关系,还能设置单个节点的参数,比如通过下面的代码设置节点的大小用来表示基因的表达量,表达量高的基因节点直径越大。还可以用过Type将节点进行分组,比如转录因子为A组,目标基因为B组等等。

df_node_net <- result_df
df_node_net$size <- runif(nrow(df_node_net),0,20)
df_node_net$type <- rep(c("A","B","C"),10000)[1:nrow(df_node_net)]
colnames(df_node_net) <- c("name""group""size","type")

绘制动态网络图

接下来通过调用forceNetwork绘制网络图,将刚刚的两个数据作为输入文件,设置如下参数即可获得结果图。

p <- forceNetwork(Links = df_edge_net, 
             Nodes = df_node_net, 
             Source = "source"
             Target = "target",
             linkColour=df_edge_net$color,
             arrows=TRUE,
             legend=TRUE,
             Value = "value",
             NodeID = "name",
             Group = "type"
             bounded=F,
             opacityNoHover = 0.5,
             linkDistance = 100,
             charge=-500,
             Nodesize='size',
             # radiusCalculation = "Math.sqrt(d.nodesize,2)*5",
             # linkWidth = JS("function(d) { return Math.sqrt(d.value)-4;}"),
             # linkDistance=JS("function(d){return 1/(d.value)*100 }"),
             opacity = 0.9,
             zoom = T,
             fontFamily = "Aril",
             fontSize = 12) 
p
alt

这张图是通过JS实现的,因此支持动态交互,比如将鼠标放在节点上会显示节点名称(基因ID),还可以拖动节点查看与之关联节点。

alt

如果想要将其保存下来,最好的方法是html格式,这样仍具有动态交互属性。

saveNetwork(network = p,file = 'Net.html')

今天分享的内容就到这里,感谢您的阅读,如需本文代码和数据,请把收件邮箱发在评论区,欢迎点赞转发分享。

本文由 mdnice 多平台发布

这篇关于R语言绘制动态网络图Network教程WGCNA的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/928118

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

动态规划---打家劫舍

题目: 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存放金额的非负整数数组,计算你 不触动警报装置的情况下 ,一夜之内能够偷窃到的最高金额。 思路: 动态规划五部曲: 1.确定dp数组及含义 dp数组是一维数组,dp[i]代表

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

【WebGPU Unleashed】1.1 绘制三角形

一部2024新的WebGPU教程,作者Shi Yan。内容很好,翻译过来与大家共享,内容上会有改动,加上自己的理解。更多精彩内容尽在 dt.sim3d.cn ,关注公众号【sky的数孪技术】,技术交流、源码下载请添加微信号:digital_twin123 在 3D 渲染领域,三角形是最基本的绘制元素。在这里,我们将学习如何绘制单个三角形。接下来我们将制作一个简单的着色器来定义三角形内的像素

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

Flutter 进阶:绘制加载动画

绘制加载动画:由小圆组成的大圆 1. 定义 LoadingScreen 类2. 实现 _LoadingScreenState 类3. 定义 LoadingPainter 类4. 总结 实现加载动画 我们需要定义两个类:LoadingScreen 和 LoadingPainter。LoadingScreen 负责控制动画的状态,而 LoadingPainter 则负责绘制动画。