本文主要是介绍三代ONT测序的fast5和fastq数据中pass、fail和skip三个文件夹含义,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
牛津纳米孔技术(ONT,Oxford Nanopore Technologies)公司的生产的测序产品从小到大,常用的主要是接512通道芯片的MinION和接3000通道芯片的PromethION两款测序仪。其中两者均可生产包括原始fast5格式数据(包含测序条件等数据)和碱基识别后的fastq格式数据(含质量值的数据)。如图最新一次MinION下机数据,其中电脑驱动软件为MinKNOW(内置Guppy)。
fast5_fail是指碱基识别过程不合格数据对应的fast5原始数据(不满足要求质量值),fast5_pass是指碱基识别过程合格数据对应的fast5原始数据(满足要求质量值),fast5_skip是指未跳过碱基识别的fast5原始数据,fastq_fail是指碱基识别不合格数据,fastq_pass是指碱基识别合格数据。fastq一般会根据mean_qscore_template进行划分,即以每条reads的质量值为标准划分,一般快速模式质量值小于7为fail,质量值大于7为pass;一般高精度模式质量值小于9为fail,质量值大于9为pass。
这篇关于三代ONT测序的fast5和fastq数据中pass、fail和skip三个文件夹含义的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!