Oxford Nanopore Technologies实战应用之电信号比对工具Tombo

2023-10-25 05:41

本文主要是介绍Oxford Nanopore Technologies实战应用之电信号比对工具Tombo,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、前言

 二、Tombo快速使用

1.安装

2.快速使用

 3.比对结果解析

4.高阶应用

三、总结


一、前言

对于纳米孔测序常规用途,如基因组比对、SNV鉴别、宏基因组物种分析而言,用户一般使用碱基识别软件输出的fastq文件即可展开相应分析。但对于某些特殊用途,如甲基化鉴别、碱基识别算法开发,则需要深入分析纳米孔测序产生的fast5文件中原始电信号与碱基(A/T/G/C)之间的对应关系。那么,有没有软件可以实现这种功能呢?答案是ONT官方发布的软件Tombo。

 二、Tombo快速使用

1.安装

使用conda进行快速安装。

# install via bioconda environment (https://bioconda.github.io/#set-up-channels)
conda install -c bioconda ont-tombo

2.快速使用

假定fast5文件中已经有basecalls(即ATGC碱基),且Reference序列已知,那么最快速使用Tombo进行电信号比对的命令如下。输出的比对结果会写入到fast5文件中。

tombo resquiggle path/to/fast5s/ genome.fasta --processes 4 --num-most-common-errors 5

 3.比对结果解析

首先要读入fast5文件,可以使用h5py中的h5py.File函数读入,也可以使用其他第三方fast5分析软件。

import h5py
fast5_info = h5py.File(fast5_path, 'r')

然后,就可以在fast5_info['Analyses']['RawGenomeCorrected_000']['BaseCalled_template']['Events'][:]中找到碱基与电信号的对应关系。

并且,可以通过fast5_info['Analyses']['RawGenomeCorrected_000']['BaseCalled_template']['Alignment']的attrs来查看每条fast5与参考序列的比对信息,如比对起止位点、正负链信息等。

4.高阶应用

随着ONT测序技术的更新,并非所有fast5文件都可以直接被Tombo读入,此时需要考虑2个问题:

(1)fast5中是否有basecalls?某些用户在设置测序控制软件时,产生的fast5并不一定含有basecalls,此时就需要re-basecalling。

(2)fast5可能使用了VBZ压缩,此时就需要先安装hdf5插件(参考https://github.com/nanoporetech/vbz_compression/),然后才能继续使用h5py读取fast5。

三、总结

其实使用tombo resquiggle进行电信号比对还有许多细节需要注意,有兴趣的读者可以参考其说明书(https://nanoporetech.github.io/tombo/resquiggle.html)。比如,reads相对于reference序列出现了Indel(下图所示)要怎么获取电信号,Tombo也给出了解决方案。

这篇关于Oxford Nanopore Technologies实战应用之电信号比对工具Tombo的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/280389

相关文章

MyBatis分页查询实战案例完整流程

《MyBatis分页查询实战案例完整流程》MyBatis是一个强大的Java持久层框架,支持自定义SQL和高级映射,本案例以员工工资信息管理为例,详细讲解如何在IDEA中使用MyBatis结合Page... 目录1. MyBATis框架简介2. 分页查询原理与应用场景2.1 分页查询的基本原理2.1.1 分

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

SpringBoot 多环境开发实战(从配置、管理与控制)

《SpringBoot多环境开发实战(从配置、管理与控制)》本文详解SpringBoot多环境配置,涵盖单文件YAML、多文件模式、MavenProfile分组及激活策略,通过优先级控制灵活切换环境... 目录一、多环境开发基础(单文件 YAML 版)(一)配置原理与优势(二)实操示例二、多环境开发多文件版

Three.js构建一个 3D 商品展示空间完整实战项目

《Three.js构建一个3D商品展示空间完整实战项目》Three.js是一个强大的JavaScript库,专用于在Web浏览器中创建3D图形,:本文主要介绍Three.js构建一个3D商品展... 目录引言项目核心技术1. 项目架构与资源组织2. 多模型切换、交互热点绑定3. 移动端适配与帧率优化4. 可

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Java 正则表达式的使用实战案例

《Java正则表达式的使用实战案例》本文详细介绍了Java正则表达式的使用方法,涵盖语法细节、核心类方法、高级特性及实战案例,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录一、正则表达式语法详解1. 基础字符匹配2. 字符类([]定义)3. 量词(控制匹配次数)4. 边