NBT:快准全!geNomad——宏病毒组鉴定新工具

2023-10-20 13:21

本文主要是介绍NBT:快准全!geNomad——宏病毒组鉴定新工具,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

期刊:nature biotechnology

影响因子:46.9

发表时间:2023年9月

在测序数据中识别可移动遗传元件对了解其多样性、生态学、生物技术应用和对公共健康的影响至关重要。本研究开发了geNomad——可同时识别和注释测序数据中的质粒和病毒序列。geNomad使用227897个标记蛋白图谱的数据集来提供病毒基因组的功能基因注释和分类匹配。geNomad还使用条件随机场模型高精度检测整合到宿主基因组中的前病毒。在线使用网址:https://portal.nersc.gov/genomad.

图1 geNomad网页主页面

1、鉴定和注释质粒和病毒的框架

geNomad采用混合方法进行质粒和病毒鉴定,结合了无比对分类器(序列分支)和基于基因的分类器(标记分支),通过利用两种分类器的优势来提高分类性能。

图片

图2 鉴定和注释质粒和病毒的框架

2、生成蛋白质图谱数据集,用于序列分类和蛋白质注释

geNomad使用染色体、质粒或病毒特异性的227,897个蛋白质谱的标记物集对基因进行分类,并为处理的序列提供功能信息。

图片

图3  蛋白质图谱数据集

3、geNomad可准确识别质粒和病毒

与其他工具相比,geNomad在质粒和病毒分类任务中,在所有序列长度范围内均表现出较好的总体分类性能,短序列中尤其明显。

图片

图4  基因组准确地识别病毒和质粒

4、敏感、精确的鉴定前噬菌体

其他流行工具(Phigaro39、VIBRANT和VirSorter2)进行了比较,geNomad性能更优,划分的前噬菌体更完整,污染水平较低。

图片

图5  使用标记信息来划分原噬菌体的边界

5、geNomad运行速度快,可对大型数据集进行分析

其他流行工具相比,geNomad运行速度快,并且geNomad的标记和序列分支可以独立运行,可以将运行时间减少一半。geNomad最近被用于处理超过2.7万亿个碱基对的测序数据,从而发现了数百万种包含在IMG/VR和IMG/PR数据库中的病毒和质粒。 

表1  质粒和病毒鉴定工具的分类方法和平均运行时间

图片

6、geNomad可以发现RNA病毒和巨型病毒

开发者使用病毒的最新知识训练geNomad,大大提高了geNomad对RNA病毒和巨型病毒的鉴定能力。

图片

图6  环境测序数据中发现RNA病毒和巨型病毒

结论

geNomad结合基因信息和深度神经网络信息来识别质粒和病毒序列,使用了超过200,000个标记蛋白谱的数据集对病毒基因组的功能基因进行注释和分类分配。使用条件随模型,高精度地检测整合到宿主基因组中的前噬菌体。在基准测试中,各种性能大大优于其他工具。


凌恩生物宏病毒分析流程已更新使用geNomad,用于宏病毒数据中前噬菌体的鉴定。更多测序项目了解,请关注凌恩生物公众号,紧跟CNS步伐,用最新的流程助力您的科研! 


参考文献

Identification of mobile genetic elements with geNomad.nature biotechnology,2023.

这篇关于NBT:快准全!geNomad——宏病毒组鉴定新工具的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/247383

相关文章

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

使用Java实现通用树形结构构建工具类

《使用Java实现通用树形结构构建工具类》这篇文章主要为大家详细介绍了如何使用Java实现通用树形结构构建工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录完整代码一、设计思想与核心功能二、核心实现原理1. 数据结构准备阶段2. 循环依赖检测算法3. 树形结构构建4. 搜索子

利用Python开发Markdown表格结构转换为Excel工具

《利用Python开发Markdown表格结构转换为Excel工具》在数据管理和文档编写过程中,我们经常使用Markdown来记录表格数据,但它没有Excel使用方便,所以本文将使用Python编写一... 目录1.完整代码2. 项目概述3. 代码解析3.1 依赖库3.2 GUI 设计3.3 解析 Mark

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

jvm调优常用命令行工具详解

《jvm调优常用命令行工具详解》:本文主要介绍jvm调优常用命令行工具的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一 jinfo命令查看参数1.1 查看jvm参数二 jstack命令2.1 查看现场堆栈信息三 jstat 实时查看堆内存,gc情况3.1

MySQL使用binlog2sql工具实现在线恢复数据功能

《MySQL使用binlog2sql工具实现在线恢复数据功能》binlog2sql是大众点评开源的一款用于解析MySQLbinlog的工具,根据不同选项,可以得到原始SQL、回滚SQL等,下面我们就来... 目录背景目标步骤准备工作恢复数据结果验证结论背景生产数据库执行 SQL 脚本,一般会经过正规的审批

基于Python开发批量提取Excel图片的小工具

《基于Python开发批量提取Excel图片的小工具》这篇文章主要为大家详细介绍了如何使用Python中的openpyxl库开发一个小工具,可以实现批量提取Excel图片,有需要的小伙伴可以参考一下... 目前有一个需求,就是批量读取当前目录下所有文件夹里的Excel文件,去获取出Excel文件中的图片,并

Java导入、导出excel用法步骤保姆级教程(附封装好的工具类)

《Java导入、导出excel用法步骤保姆级教程(附封装好的工具类)》:本文主要介绍Java导入、导出excel的相关资料,讲解了使用Java和ApachePOI库将数据导出为Excel文件,包括... 目录前言一、引入Apache POI依赖二、用法&步骤2.1 创建Excel的元素2.3 样式和字体2.

基于Python开发PDF转PNG的可视化工具

《基于Python开发PDF转PNG的可视化工具》在数字文档处理领域,PDF到图像格式的转换是常见需求,本文介绍如何利用Python的PyMuPDF库和Tkinter框架开发一个带图形界面的PDF转P... 目录一、引言二、功能特性三、技术架构1. 技术栈组成2. 系统架构javascript设计3.效果图

MyBatis-Plus中静态工具Db的多种用法及实例分析

《MyBatis-Plus中静态工具Db的多种用法及实例分析》本文将详细讲解MyBatis-Plus中静态工具Db的各种用法,并结合具体案例进行演示和说明,具有很好的参考价值,希望对大家有所帮助,如有... 目录MyBATis-Plus中静态工具Db的多种用法及实例案例背景使用静态工具Db进行数据库操作插入