HiC-Pro的Singularity简明使用指南

2024-06-23 19:48

本文主要是介绍HiC-Pro的Singularity简明使用指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于原理部分和更详细的介绍,见HiC-Pro: Hi-C数据预处理高效工具, 这里只介绍如何快速使用Singularity的HiC-Pro进行数据分析。

关键内容就是,config-hicpro.txt 里的文件路径信息都必须是绝对路径,否则默认都位于annotation目录下。切记,切记,切记。

第零步: Singularity的HiC-Pro镜像下载,

# 下载
mkdir -p /opt/biosoft/HiC-Pro 
cd /opt/biosoft/HiC-Pro 
wget https://zerkalo.curie.fr/partage/HiC-Pro/singularity_images/hicpro_latest_ubuntu.img
# 使用
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -h

第一步:建立输入数据文件夹, 数据不能是软连接形式,只能是复制或者移动

mkdir -p fastq/xxx
cp xxx_R1.fastq.gz xxx_R2.fastq.gz  fastq/xxx/
# 如果有多个样本
mkdir -p fastq/yyy
cp yyy_R1.fastq.gz yyy_R2.fastq.gz  fastq/yyy/

第二步:创建参考数据库,需要修改ENZYME

ENZYME=DpnII
# build reference
mkdir reference
mv 你的参考序列.fasta  reference/genome.fa
# enzyme site
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \/usr/local/bin/HiC-Pro_2.11.4/bin/utils/digest_genome.py -r $ENZYME \-o reference/genome_${ENZYME}.bed reference/genome.fa
# genome size
seqkit fx2tab -nl reference/genome.fa | awk '{print $1"\t"$2}' > reference/genome.chrom.size
# bowtie/2.3.4.3
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \bowtie2-build --threads 60 reference/genome.fa reference/genome

第三步: 复制配置文件并修改

# config
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \cp /usr/local/bin/HiC-Pro_2.11.4/config-hicpro.txt  config-hicpro.txt

修改其中的如下项,

  • N_CPU=80 线程数
  • BOWTIE2_IDX_PATH: 必须是绝对路径,例如 /home/xzg/reference
  • REFERENCE_GENOME=genome
  • GENOME_SIZE=必须是绝对路径, 例如/home/xzg/reference/genome.chrom.size
  • GENOME_FRAGMENT= 必须是绝对路径 例如/home/xzg/reference/genome_DpnII.bed
  • LIGATION_SITE=根据实际酶切位点来, 例如DpnII和MBoI都是GATCGATC

第四步:运行

singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -i fastq -o results -c config-hicpro.txt ```

这篇关于HiC-Pro的Singularity简明使用指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088106

相关文章

Deepseek使用指南与提问优化策略方式

《Deepseek使用指南与提问优化策略方式》本文介绍了DeepSeek语义搜索引擎的核心功能、集成方法及优化提问策略,通过自然语言处理和机器学习提供精准搜索结果,适用于智能客服、知识库检索等领域... 目录序言1. DeepSeek 概述2. DeepSeek 的集成与使用2.1 DeepSeek API

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

Rsnapshot怎么用? 基于Rsync的强大Linux备份工具使用指南

《Rsnapshot怎么用?基于Rsync的强大Linux备份工具使用指南》Rsnapshot不仅可以备份本地文件,还能通过SSH备份远程文件,接下来详细介绍如何安装、配置和使用Rsnaps... Rsnapshot 是一款开源的文件系统快照工具。它结合了 Rsync 和 SSH 的能力,可以帮助你在 li

什么是cron? Linux系统下Cron定时任务使用指南

《什么是cron?Linux系统下Cron定时任务使用指南》在日常的Linux系统管理和维护中,定时执行任务是非常常见的需求,你可能需要每天执行备份任务、清理系统日志或运行特定的脚本,而不想每天... 在管理 linux 服务器的过程中,总有一些任务需要我们定期或重复执行。就比如备份任务,通常会选在服务器资

Ubuntu 24.04 LTS怎么关闭 Ubuntu Pro 更新提示弹窗?

《Ubuntu24.04LTS怎么关闭UbuntuPro更新提示弹窗?》Ubuntu每次开机都会弹窗提示安全更新,设置里最多只能取消自动下载,自动更新,但无法做到直接让自动更新的弹窗不出现,... 如果你正在使用 Ubuntu 24.04 LTS,可能会注意到——在使用「软件更新器」或运行 APT 命令时,

最便宜的8口2.5G网管交换机! 水星SE109 Pro拆机测评

《最便宜的8口2.5G网管交换机!水星SE109Pro拆机测评》水星SE109Pro价格很便宜,水星SE109Pro,外观、接口,和SE109一样,区别Pro是网管型的,下面我们就来看看详细拆... 听说水星SE109 Pro开卖了,PDD卖 220元,于是买回来javascript拆机看看。推荐阅读:水

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

VMware Fusion Pro 13 Mac版虚拟机 安装Win11系统教程

Mac分享吧 文章目录 Win11安装完成,软件打开效果一、VMware安装Windows11虚拟机1️⃣:准备镜像2️⃣:创建虚拟机3️⃣:虚拟机设置4️⃣:安装虚拟机5️⃣:解决连不上网问题 安装完成!!! Win11安装完成,软件打开效果 一、VMware安装Windows11虚拟机 首先确保自己的mac开启了网络共享。不然虚拟机连不上👀的 1️⃣:准备镜像

Maven使用指南的笔记

文档索引 Maven in 5 Minutes 篇幅很短,快速上手,不求甚解。 执行如下命令,创建项目的基础配置。 mvn archetype:generate -DgroupId=com.mycompany.app -DartifactId=my-app -DarchetypeArtifactId=maven-archetype-quickstart -DarchetypeVersion=1

ArcGIS Pro 克隆clone python环境报错问题处理方法

ArcGIS Pro 克隆clone python环境报错问题处理方法 (一)安装arcpro和深度学习安装包 首先安装arcgis pro桌面版和深度学习安装包后 然后克隆默认 Python 环境 arcgispro-py3 接下来,安装以下 Python 软件包:Tensorflow、fast.ai、Keras、Pytorch、Scikit-image、Pillow 和 Libtiff。 切