生物信息学入门 富集分析与蛋白质互作用网络(PPI)的可视化 Cystocape入门指南

本文主要是介绍生物信息学入门 富集分析与蛋白质互作用网络(PPI)的可视化 Cystocape入门指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

网络图是生物信息学中常用的显示不同节点之间关联方向与关联程度的可视化方法。在富集分析中,网络图常被用于表示功能与估计到该功能的基因的联系。在蛋白质互作用网络中,网络图常用于表示编码基因之间的互作用类型与作用强度,基于这些信息,还可以通过某一节点与其他节点的连接数量来判断该节点在整个网络中的贡献度(degree)。绘制网络图常使用cystoscape软件,通过输入符合规范的数据,调整合适的参数,就可以得到一张包含多样化信息的网络。本文将从结果解读开始,先介绍网络图中常可以展示的信息类型,再介绍如何准备数据和调整参数。

1. 结果解读

这张图中包含的信息有:

1. 12个节点的对应关系

2. 不同节点有不同的颜色,代表所属组别,是定性属性

3. 不同的节点有不同的大小,代表某种定量属性

4. 不同连接线有不同的颜色,代表对应的互作用关系的作用类型,是定性属性

5. 不同连接线有不同的宽度,代表对应的互作用关系的作用强度,是定量属性

2. 数据准备

2.1 必需元素

如前所述,网络图是表示节点及其连接关系的图,因此,节点和对应关系是网络图的必需元素,也就是表格中的A列和B列。可以看到,有节点A1-A11均与节点B存在关联,反过来,节点B和节点A1-A11存在一对多的关系。

2.2 节点连接关系

既然节点之间存在连接关系,那么如何定义这种关系呢?在这里,我们使用了两个信息来描述,即C列的作用强度和D列的作用方向。作用强度通常可以由数据库给出,作用方向是使用-1表示负相关,1表示正相关。这样,我们就不仅知道两个节点有关联,还可以定量和定性的描述这种关联。

2.3 节点属性

在实际应用中,不同的节点具有不同的属性。比如用于描述miRNA-mRNA调节关系的网络中,每一个节点将会属于miRNA或者mRNA,那么我们就可以再添加一列信息用于描述这种属性。在本文中,我们假设A1-A11和B表示各不相同的12个基因,它们对于某一特定疾病具有不同的影响,如果增加患病风险,我们使用一个正值表示,数值越大,则表示增加的风险越多(risk factor),反之亦然。在表中,E列和G列分别定量地表示Gene1(A1-A11)与Gene2(B)对疾病的影响强度和方向。F和H则定性的表示这种方向。

3. 参数调整

3.1 输入准备好的表格

给不同的列定义作用类别

Gene1列定义为source node,表示作为一个出发点

Gene2列定义为target node,表示作为一个目标终点

cystoscape中的连接使用edge描述,因此edge attribute表示连接属性。说明这一列的数据都是用来描述前面两个对应的节点的连接属性的,即包含了连接属性的定量或定性信息。

source node attribute表示出发点属性。说明这一列的数据都是用来描述source node列的节点的节点属性,即包含了节点本身性质的一些信息,比如对疾病影响强度与方向。

target node attribute表示目标节点点属性。说明这一列的数据都是用来描述target node列的节点的节点属性,即包含了节点本身性质的一些信息,比如对疾病影响强度与方向。

之后就得到了最原始的一张网络图

3.2 在网络图中添加输入的参数信息

可以非常明显的看到这种图除了比较丑之外,还丢失了很多信息。事实上,它支包含了节点之间的对应信息,而节点属性和连接属性均没有体现在图上。下面来演示一下如何添加对应的信息。

在左侧style列选择一个预设的风格

在左下角选择node,上方的界面就会显示node节点的参数列表

下面调整节点的颜色,将对疾病有正向影响的节点表示为红色,负影响的节点表示为蓝色,B节点表示为绿色

完成之后

在左下角选择edge 如图所示,点击对应参数栏右下角的垃圾桶标记将连接线上的文字去掉

在最下面的width栏调节线的宽度,在这里我们用宽度表示互作用强度,设置如下

但是连接线太宽了,可以通过双击左下角的图表设置

这样线条的宽度就比较合适了

下面我们来调节线条的颜色,用橙色表示正相关,紫色表示负相关。这里我们用到了定性的参数,分贝对1和-1的连接线定义颜色,就可以快速的进行调整。

现在节点的对疾病的影响强度还没有显示,我们可以通过和调节线条宽度类似的操作来实现,先将进入node的参数列表

再调整一下字体大小,一张好看的网络图就完成了

Cystoscape是一款功能非常强大的软件,这里仅展示了一小部分功能。应结合 数据类型-参数设置方法-显示结果 的对应关系,灵活使用!

附:

Gene1Gene2COX_interactionCOX_interaction_directioneffect_Gene1effect_direction_Gene1effect_Gene2effect_direction_Gene2
A1B0.49998834513.25833384510.0112023221
A2B-0.516532244-1-3.878273038-10.0112023221
A3B0.41524582412.01047664610.0112023221
A4B0.44035785811.86937052610.0112023221
A5B0.41242079311.63010053810.0112023221
A6B-0.407099469-1-2.244444104-10.0112023221
A7B-0.451728351-1-1.227808813-10.0112023221
A8B0.45172878311.22779585410.0112023221
A9B0.42060242911.26914773310.0112023221
A10B-0.406904176-1-1.572218584-10.0112023221
A11B-0.42212353-1-1.96877414-10.0112023221
        
        
        
        
        
        
        
        
        
        
        
        

GEO芯片数据差异表达分析时需要log2处理的原因

https://blog.csdn.net/tuanzide5233/article/details/88542805

GEO芯片数据差异表达分析时是否需要log2以及标准化的问题

https://blog.csdn.net/tuanzide5233/article/details/88542558

差异表达矩阵制作教程

https://blog.csdn.net/tuanzide5233/article/details/83659768

差异表达的热图绘制详见

https://blog.csdn.net/tuanzide5233/article/details/83659501

使用edgeR对RNAseq数据进行差异表达分析教程

https://blog.csdn.net/tuanzide5233/article/details/88785486

差异表达分析(DEG)时 row.names'里不能有重复的名字 的解决方案

https://blog.csdn.net/tuanzide5233/article/details/86568155

生存分析系列教程(一)使用生信人工具盒进行生存分析

https://blog.csdn.net/tuanzide5233/article/details/83685403

富集分析与蛋白质互作用网络(PPI)的可视化 Cystocape入门指南

https://blog.csdn.net/tuanzide5233/article/details/88048439

进阶版Venn plot:Upset plot入门实战代码详解——UpSetR包介绍

https://blog.csdn.net/tuanzide5233/article/details/83109527

使用R语言ggplot2包绘制pathway富集分析气泡图(Bubble图):数据结构及代码

https://blog.csdn.net/tuanzide5233/article/details/82141817

这篇关于生物信息学入门 富集分析与蛋白质互作用网络(PPI)的可视化 Cystocape入门指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/935919

相关文章

MySQL表锁、页面锁和行锁的作用及其优缺点对比分析

《MySQL表锁、页面锁和行锁的作用及其优缺点对比分析》MySQL中的表锁、页面锁和行锁各有特点,适用于不同的场景,表锁锁定整个表,适用于批量操作和MyISAM存储引擎,页面锁锁定数据页,适用于旧版本... 目录1. 表锁(Table Lock)2. 页面锁(Page Lock)3. 行锁(Row Lock

Nginx实现动态封禁IP的步骤指南

《Nginx实现动态封禁IP的步骤指南》在日常的生产环境中,网站可能会遭遇恶意请求、DDoS攻击或其他有害的访问行为,为了应对这些情况,动态封禁IP是一项十分重要的安全策略,本篇博客将介绍如何通过NG... 目录1、简述2、实现方式3、使用 fail2ban 动态封禁3.1 安装 fail2ban3.2 配

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

SQL Server数据库迁移到MySQL的完整指南

《SQLServer数据库迁移到MySQL的完整指南》在企业应用开发中,数据库迁移是一个常见的需求,随着业务的发展,企业可能会从SQLServer转向MySQL,原因可能是成本、性能、跨平台兼容性等... 目录一、迁移前的准备工作1.1 确定迁移范围1.2 评估兼容性1.3 备份数据二、迁移工具的选择2.1

C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep