QIIME 2 16S扩增子分析基础流程及常用命令(新手友好向)

2023-12-17 00:59

本文主要是介绍QIIME 2 16S扩增子分析基础流程及常用命令(新手友好向),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

整理了之前的QIIME 2 学习总结,挑选了非常基础实用的部分做一个QIIME 2 学习大礼包(没错就是这篇文章)。对基础分析的流程来说内容涵盖非常全。
我觉得很适合当作工具书来使用_(:з)∠)_
如果有帮到你请给一个赞哦~👍
下载这篇文章的 PDF 版随时查阅:QIIME2扩增子分析流程及常用命令.pdf

以下是正文内容:


必看:

  • QIIME 2 官方论坛(非常有用哦)

  • 使用该页面查看 QIIME 2 的 qzv 后缀可视化文件

  • QIIME 2 官方文档:
    【中文参考】
    【英文原版】 https://docs.qiime2.org/2020.11/
    官方文档会隔几个月更新一次,而我不会同步更新链接, 点链接进去戳【Latest Docs】按钮就好啦。每个版本的更新内容在官方论坛里可以找到。😊

  • 推荐一看的参考教程(中文版):
    QIIME 2用户文档.4人体各部位微生物组分析实战Moving Pictures

  • QIIME 2 安装教程:https://docs.qiime2.org/2020.6/install/


目录

  • 一、将16S 数据导入QIIME 2
    • 1. 生成原始数据的file path文件
    • 2. 导入QIIME2
  • 二、降噪(Denoise)流程
    • 1. Deblur 流程
      • (1)先使用QIIME 2的 vsearch 接口做join pairs
      • (2)按测序碱基质量过滤序列
      • (3)降噪
    • 2. Dada 2 流程
      • (1)降噪
    • 3. table.qza(拓展内容)
  • 三、过滤feature table
    • 1. 按代表序列数量过滤
    • 2. 偶然因素过滤
    • 3. 过滤序列
  • 四、各个OTU的代表序列及系统发育树的构建
    • 1. 为Alpha多样性分析提供系统发育树
    • 2. 导出上一步生成的进化树
  • 五、多样性分析
    • 1. 多样性指数介绍
      • (1) Alpha多样性指数:
      • (2) Beta 多样性指数
    • 2. QIIME 2 计算多样性指数(拓展内容)
    • 3. 计算核心多样性(无树的情况)
    • 4. 计算核心多样性(系统发育树)
    • 5. Alpha多样性分析结果可视化和组间显著性分析
    • 6. Beta多样性分析结果可视化和组间显著性分析
    • 7. QIIME 2 的抽样方法(拓展内容)
    • 8. 阿尔法稀疏曲线:
  • 六、物种组成分析
    • 1. 下载 / 训练 物种注释分类器
      • (1) 准备文件:
      • (2) 训练分类器
    • 2. 物种注释和可视化
    • 3. 物种注释的堆叠柱状图
    • 4. 差异分类学级别分析:以按门水平合并再统计差异(拓展内容)
      • (1) 生成对应级别的特征表
      • (2) 去除零生成组成型特征表
      • (3) 在门水平按取样部分分析
    • 5. 合并feature count与taxonomy information (拓展内容)

一、将16S 数据导入QIIME 2

1. 生成原始数据的file path文件

该文件包含首行、每个样本的 ID、rawreads文件路径、forward或reverse信息。
首行必须是:sample-id,absolute-filepath,direction

文件格式示例:
文件格式示例

2. 导入QIIME2

输入:路径文件
输出:demux-summary.qza

单端数据使用命令:

qiime tools import --type 'SampleData[SequencesWithQuality]'  --input-path input-path-list.tsv --output-path single-end-demux.qza  --input-format SingleEndFastqManifestPhred33 

双端数据使用命令:

qiime tools import --type 'SampleData[PairedEndSequencesWithQuality]' --input-path input-path-list.tsv --output-path demux-summary.qza --input-format PairedEndFastqManifestPhred33 

生成qzv可视化文件查看数据质量:

qiime dem

这篇关于QIIME 2 16S扩增子分析基础流程及常用命令(新手友好向)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/502533

相关文章

Security OAuth2 单点登录流程

单点登录(英语:Single sign-on,缩写为 SSO),又译为单一签入,一种对于许多相互关连,但是又是各自独立的软件系统,提供访问控制的属性。当拥有这项属性时,当用户登录时,就可以获取所有系统的访问权限,不用对每个单一系统都逐一登录。这项功能通常是以轻型目录访问协议(LDAP)来实现,在服务器上会将用户信息存储到LDAP数据库中。相同的,单一注销(single sign-off)就是指

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号