QIIME2宏基因组学教程--2024年春季莱顿和苏黎世教程

2024-09-01 17:44

本文主要是介绍QIIME2宏基因组学教程--2024年春季莱顿和苏黎世教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近在qiime2论坛发现有人发布了qiime2宏基因组的教程,这里分享一下,只是alpha版本,不成熟,大家谨慎了解。qiime2的专用格式对于折腾宏基因组还是有点不妥的,个人观点,但是好在他能让分析标准化,可追溯的话,我觉得还是利大于弊的。
地址在这:宏基因组学与QIIME 2 - 2024年春季莱顿和苏黎世教程 - 宏基因组分析与QIIME2
警告
使用 QIIME 2 进行的宏基因组学分析目前处于 alpha 版本。 这意味着您生成的结果应被视为初步结果,而不是发布质量。 此外,接口可能会发生更改,并且这些更改可能向后不兼容(这意味着在 QIIME 2 Shotgun Metagenomics 发行版的一个版本中有效的命令或文件可能不适用于该发行版的下一个版本)

整体流程图


总的来说,还是比较全面的,和nf-meta的流程是类似的,是国外比较主流的流程,包含了基于reads的分析,组装和基于MAG的分析。

摘录下主要分析步骤

基于reads的分析

基于reads的物种注释,kraken2啦,适用范围更广泛。

qiime moshpit classify-kraken2 \--i-seqs ./moshpit_tutorial/cache:workshop-reads \--i-kraken2-db ./moshpit_tutorial/cache:kracken_standard \--p-threads 40 \--p-confidence 0.6 \--p-minimum-base-quality 20 \--o-hits ./moshpit_tutorial/cache:workshop_kraken_db_hits \--o-reports ./moshpit_tutorial/cache:workshop_kraken_db_reports \--p-report-minimizer-data \--use-cache ./moshpit_tutorial/cache \--parallel-config slurm_config.toml \--verbose \--p-memory-mapping False ##set to False to shorten runtime
qiime moshpit estimate-bracken \--i-bracken-db ./moshpit_tutorial/cache:bracken_standard \--p-read-len 100 \--i-kraken-reports ./moshpit_tutorial/cache:workshop_kraken_db_reports \--o-reports ./moshpit_tutorial/kraken-outputs/bracken-reports.qza \--o-taxonomy ./moshpit_tutorial/kraken-outputs/taxonomy-bracken.qza \--o-table ~./moshpit_tutorial/kraken-outputs/table-bracken.qza

基于组装的分析

megahit,同样主流的软件啦!

恢复宏基因组组装基因组 (MAG) 的第一步是基因组组装本身。有许多基因组组装器可用,其中两个您可以通过我们的 QIIME 2 插件使用 - 在这里,我们将使用 MEGAHIT。MEGAHIT 采用短的 DNA 测序读数,构建简化的 De Bruijn 图,并生成更长的连续序列(称为重叠群),为我们下一步的分析提供有价值的遗传信息。

qiime assembly assemble-megahit \--i-seqs "./moshpit_tutorial/cache:reads_no_host" \--p-presets "meta-sensitive" \--p-num-cpu-threads 64 \--p-num-partitions 4 \--o-contigs "./moshpit_tutorial/cache:contigs" \--verbose

使用 QUAST 的 Contig QC

一旦读取片段被组装成重叠群,我们就可以使用 QUAST 来评估我们的组装质量。

qiime assembly evaluate-contigs \--i-contigs "./moshpit_tutorial/cache:contigs" \--p-threads 128 \--p-memory-efficient \--o-visualization "./moshpit_tutorial/results/contigs.qzv" \--verbose

alpha多样性分析中,还可以使用线性混合效应模型来管理数据集中的重复测量。

qiime longitudinal linear-mixed-effects \--m-metadata-file sample-metadata.tsv ./contigs/obs-features-autofmt-contigs.qza \--p-state-column day-relative-to-fmt \--p-group-columns autoFmtGroup \--p-individual-id-column PatientID \--p-metric "observed_features" \--o-visualization ./contigs/lme-obs-features-treatmentVScontrol-contigs.qzv

基于 MAG 的分析

让我们开始使用各种工具和方法将重叠群分箱到 MAG 中!
读取映射
我们首先需要对组装步骤中获得的重叠群进行索引,并使用该索引将原始读数映射到这些重叠群。然后,重叠群 binner 可以使用这种读取映射来找出哪些重叠群来自同一基因组并将它们放在一起。

  --i-contigs  "./moshpit_tutorial/cache:contigs"  \--p-seed  100  \--p-threads  64  \--p-verbose  \--p-num-partitions  4  \--o-index  "./moshpit_tutorial/cache:contigs_index"  \--verbose
qiime  assembly  map-reads-to-contigs  \--i-indexed-contigs  "./moshpit_tutorial/cache:contigs_index"  \--i-reads  "./moshpit_tutorial/cache:reads_no_host"  \--p-seed  100  \--p-threads  64  \--p-num-partitions  4  \--o-alignment-map  "./moshpit_tutorial/cache:reads_to_contigs"  \--verbose

分箱

最后,我们准备执行重叠群分箱。这个过程涉及根据重叠群可能来自混合群落内不同微生物物种或菌株的可能来源,将重叠群分类为不同的箱或组。在这里,我们将使用 MetaBAT 2 工具,该工具使用四核苷酸频率和丰度(覆盖率)信息将重叠群分配给各个 bin。

  --i-contigs  "./moshpit_tutorial/cache:contigs"  \--i-alignment-maps  "./moshpit_tutorial/cache:reads_to_contigs"  \--p-seed  100  \--p-num-threads  128  \--p-verbose  \--o-mags  "./moshpit_tutorial/cache:mags"  \--o-contig-map  "./moshpit_tutorial/cache:contig_map"  \--o-unbinned-contigs  "./moshpit_tutorial/cache:unbinned_contigs"  \--verbose

此步骤生成了几个项目:

  • mags.qza:这些是我们每个样品的实际 MAGS。

  • contig-map.qza:这是 MAG ID 与属于给定 MAG 的重叠群 ID 之间的映射。

  • unbinned-contigs.qza:这些是无法分配给任何特定 MAG 的所有重叠群。 从这里开始,我们将重点介绍 mags.qza 工件。

使用 BUSCO 进行 MAGs 质量控制

这里使用 BUSCO 通过搜索基因组内的单拷贝直系同源基因来评估 MAGs 的完整性和质量。

  --i-bins  "./moshpit_tutorial/cache:mags"  \--p-lineage-dataset  bacteria_odb10  \--p-cpu  196  \--o-visualization  "./moshpit_tutorial/results/mags.qzv"  \--verbose```### BUSCO QC[](https://cap-lab.bio/q2-books/80-leiden-tutorial.html#busco-qc "Permalink to this heading")在这里,我们将查看我们的 BUSCO 结果,以评估 MAG 的完整性和质量!```wget  -O  busco-qc.qzv  https://polybox.ethz.ch/index.php/s/fzAA003m6UVw5je/download

获取我们的 Kraken2 报告

QIIME 2 不会阻止您使用您最喜欢的工具及其输出!首先,让我们从此数据集中获取一个包含 Kraken 2 注释 MAG 的工件。我们将用 pavian 可视化其中一些。

Kraken2 注释报告导出

现在,让我们导出这个 QIIME 工件并进行探索!

  --input-path  kraken2-reports-mags-derep.qza  \--output-path  kraken2-reports-mags-derep

Provenance 重播

如果不回顾我们在本教程中运行的所有命令,你们中有多少人有信心从内存中重新运行我们的分析?如果你对此没有信心,你并不孤单!很难记住您为过去的分析运行的确切命令(或试图找出其他人从外部分析中运行的命令)是很常见的。即使你写下了你所采取的所有步骤,人类也会犯错,我们的记忆也不完美。

每个 QIIME 2 结果(即 Artifact 或 Visualization)都包含可参考的来源,这些来源可以用作参考来重建用于生成所述结果的命令。让我们以基于读取的分析中的可视化之一为例,看看与其中一个可视化相关联的来源!

虽然使用 Provenance 手动重建用于生成结果的命令对于一两个结果来说是一个合理的工作流程,但我们需要一个自动化程度更高的解决方案来重建命令以进行更大规模的分析,例如我们在本研讨会中运行的分析。幸运的是,Provenance Replay 可以帮我们处理这个问题!

首先,我们将对本教程中生成的所有基于读取的结果运行 provenance replay。我们可以在整个目录上运行 provenance replay。这将为我们提供一个重播补充,其中包含用于生成每个结果的所有上游命令、与使用的每个命令相关的任何相关引用(以 BibTex 格式)以及每个命令中使用的记录元数据。

--in-fp  ./reads  \
--out-fp  reads-replay-output

您可以自己尝试为所有基于 contig 的结果生成重播补充,并重建该分析中使用的一些命令!

由 Bokulich 和 Caporaso Labs© 版权所有 2024。

这篇关于QIIME2宏基因组学教程--2024年春季莱顿和苏黎世教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1127627

相关文章

Python中Tkinter GUI编程详细教程

《Python中TkinterGUI编程详细教程》Tkinter作为Python编程语言中构建GUI的一个重要组件,其教程对于任何希望将Python应用到实际编程中的开发者来说都是宝贵的资源,这篇文... 目录前言1. Tkinter 简介2. 第一个 Tkinter 程序3. 窗口和基础组件3.1 创建窗

Python中Request的安装以及简单的使用方法图文教程

《Python中Request的安装以及简单的使用方法图文教程》python里的request库经常被用于进行网络爬虫,想要学习网络爬虫的同学必须得安装request这个第三方库,:本文主要介绍P... 目录1.Requests 安装cmd 窗口安装为pycharm安装在pycharm设置中为项目安装req

JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)

《JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)》:本文主要介绍如何在IntelliJIDEA2020.1中创建和部署一个JavaWeb项目,包括创建项目、配置Tomcat服务... 目录简介:一、创建项目二、tomcat部署1、将tomcat解压在一个自己找得到路径2、在idea中添加

Python + Streamlit项目部署方案超详细教程(非Docker版)

《Python+Streamlit项目部署方案超详细教程(非Docker版)》Streamlit是一款强大的Python框架,专为机器学习及数据可视化打造,:本文主要介绍Python+St... 目录一、针对 Alibaba Cloud linux/Centos 系统的完整部署方案1. 服务器基础配置(阿里

Spring IOC核心原理详解与运用实战教程

《SpringIOC核心原理详解与运用实战教程》本文详细解析了SpringIOC容器的核心原理,包括BeanFactory体系、依赖注入机制、循环依赖解决和三级缓存机制,同时,介绍了SpringBo... 目录1. Spring IOC核心原理深度解析1.1 BeanFactory体系与内部结构1.1.1

SpringBoot集成iText快速生成PDF教程

《SpringBoot集成iText快速生成PDF教程》本文介绍了如何在SpringBoot项目中集成iText9.4.0生成PDF文档,包括新特性的介绍、环境准备、Service层实现、Contro... 目录SpringBoot集成iText 9.4.0生成PDF一、iText 9新特性与架构变革二、环

2025最新版Android Studio安装及组件配置教程(SDK、JDK、Gradle)

《2025最新版AndroidStudio安装及组件配置教程(SDK、JDK、Gradle)》:本文主要介绍2025最新版AndroidStudio安装及组件配置(SDK、JDK、Gradle... 目录原生 android 简介Android Studio必备组件一、Android Studio安装二、A

前端Visual Studio Code安装配置教程之下载、汉化、常用组件及基本操作

《前端VisualStudioCode安装配置教程之下载、汉化、常用组件及基本操作》VisualStudioCode是微软推出的一个强大的代码编辑器,功能强大,操作简单便捷,还有着良好的用户界面,... 目录一、Visual Studio Code下载二、汉化三、常用组件1、Auto Rename Tag2

JavaScript装饰器从基础到实战教程

《JavaScript装饰器从基础到实战教程》装饰器是js中一种声明式语法特性,用于在不修改原始代码的情况下,动态扩展类、方法、属性或参数的行为,本文将从基础概念入手,逐步讲解装饰器的类型、用法、进阶... 目录一、装饰器基础概念1.1 什么是装饰器?1.2 装饰器的语法1.3 装饰器的执行时机二、装饰器的

MySQL 5.7彻底卸载与重新安装保姆级教程(附常见问题解决)

《MySQL5.7彻底卸载与重新安装保姆级教程(附常见问题解决)》:本文主要介绍MySQL5.7彻底卸载与重新安装保姆级教程的相关资料,步骤包括停止服务、卸载程序、删除文件和注册表项、清理环境... 目录一、彻底卸载旧版本mysql(核心步骤)二、MySQL 5.7重新安装与配置三、常见问题解决总结废话不多