使用PopLDdecay软件绘制LD衰减图

2024-03-30 10:28

本文主要是介绍使用PopLDdecay软件绘制LD衰减图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前记

PopLDdecay是一款用于进行种群遗传学和关联分析的软件。它可以在全基因组水平上进行基因型数据的相关性和衰减分析,帮助研究人员探索种群间的遗传差异和突变选择的模式。

使用PopLDdecay可以实现以下功能:

  1. 遗传距离的计算:可以计算遗传距离,包括最小二乘法估计和Cockerham和Weir的方法。
  2. 关联分析:可以计算遗传连锁块、相关关系、平衡和不平衡的情况。
  3. 衰减分析:可以计算将遗传相关性与遗传距离之间的关系进行衰减分析。

PopLDdecay支持多种数据格式的输入,包括VCF、HapMap、PLINK和BEAGLE等格式。它还提供了直观的可视化功能,可以生成遗传距离和衰减图,帮助用户更好地理解和解释结果。

此外,PopLDdecay还具有高效的计算能力和并行处理功能,可以加快分析速度,提高效率。

总之,PopLDdecay是一款功能强大且易于使用的软件,适用于基因型数据的遗传相关性和衰减分析,在种群遗传学和关联研究中具有重要的应用价值。

一、软件的安装与配置

 PopLDdecay官网地址如下:GitHub - BGI-shenzhen/PopLDdecay: PopLDdecay: a fast and effective tool for linkage disequilibrium decay analysis based on variant call format(VCF) filesicon-default.png?t=N7T8https://github.com/BGI-shenzhen/PopLDdecay

 软件的安装和配置代码如下:

#安装
git clone https://github.com/BGI-shenzhen/PopLDdecay.git
cd PopLDdecay
chmod 755 configure
./configure
make
mv PopLDdecay ./bin/#环境变量配置
vim ~/.bashrc
export PATH="/public/home/gguo/biosoft/PopLDdecay/bin:$PATH"
source ~/.bashrc

二、LD衰减距离的计算

使用VCF文件进行LD计算,代码如下:

#计算LD
cd /public/home/
PopLDdecay -InVCF sample.vcf -OutStat LDdecay#绘制LD衰减图
perl Plot_OnePop.pl -inFile LDdecay.stat.gz -output Fig

 第一行代码运行后会产生LDdecay.stat.gz文件,即为LD计算结果。

使用第二行代码进行衰减图的绘制,会产生PDF和PNG两种格式文件。

三、R可视化LD衰减图

 主要使用ggplot2包,代码如下:

######### 绘制LD衰减距离图 ###########
rm(list = ls())  # 清除工作环境中的变量
setwd("D:/Working-Folder/GWAS data/") 
library(ggplot2)ld_data <- read.table("LDdecay.txt", header = TRUE, sep = "\t")
Distance <- ld_data$Distance..Kb.
r2 <- ld_data$r.2# 检查数据
head(distance)
head(average_r2)# 创建LD衰减图
ld_plot <- ggplot(data = ld_data, aes(x = Distance, y = r2, color = Distance)) +geom_line(size = 0.5) +  # 增加线条粗细scale_color_gradient(low = "blue", high = "red") +  # 渐变色theme_minimal() +theme(legend.position = "right",  # 将图例放在图的右侧plot.title = element_text(face = "bold", size = 14, hjust = 0.5),axis.title.x = element_text(size = 12),axis.title.y = element_text(size = 12),axis.text.x = element_text(size = 10),axis.text.y = element_text(size = 10),plot.margin = margin(5.5, 14, 5.5, 14))# 增加图形边距ld_plot <- ld_plot +geom_point(size = 1.5, shape = 19, stroke = 0.5, fill = "white")  # 改变点的形状、大小和颜色ld_plot <- ld_plot +scale_x_continuous(breaks = seq(0, max(distance), by = 50), labels = seq(0, max(distance), by = 50))  # 调整x轴刻度# 显示图形
print(ld_plot)#保存
ggsave("LD_decay_plot.png", ld_plot, width = 12, height = 6, dpi = 300)

参考文献

Zhang C, Dong SS, Xu JY, He WM, Yang TL. PopLDdecay: a fast and effective tool for linkage disequilibrium decay analysis based on variant call format files. Bioinformatics. 2019 May 15;35(10):1786-1788. doi: 10.1093/bioinformatics/bty875. PMID: 30321304.

后记

 以上是PopLDdecay的简单使用方法,简单记录一下。

2024.3.29

----CXGG

千里之行,始于足下。 

这篇关于使用PopLDdecay软件绘制LD衰减图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/861235

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti