本文主要是介绍fastqc的使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
A quality control tool for high throughput sequence data.高通量测序数据的质量检测工具。 |
fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN
-o用来指定输出文件的所在目录,注意是不能自动新建目录的。输出的结果是.zip文件,默认自动解压缩,命令里加上--noextract则不解压缩。-f用来强制指定输入文件格式,默认会自动检测。-c用来指定一个contaminant文件,fastqc会把overrepresented sequences往这个
contaminant文件里搜索。contaminant文件的格式是"Name\tSequences",#开头的行是注释。加上 -q 会进入沉默模式,即不出现下面的提示:
Started analysis of target.fq
Approx 5% complete for target.fq
Approx 10% complete for target.fq
如果输入的fastq文件名是target.fq,fastqc的输出的压缩文件将是target.fq_fastqc.zip。解压后,查看html格式的结果报告
——————————————————————————————————————————————————————————————————————————————————————————————————————
我的运行:
$ fastqc 1.fa 2.fa
运行结束之后,用winSCP将文件夹传输到windows上面查看网页。
一般主要的是这个图片,如果集中在绿色部分说明质量比较高,可以使用这个转录组数据。
——————————————————————————————————————————————————————————————————————
下面的图明显质量更高!
A quality control tool for high throughput sequence data. |
这篇关于fastqc的使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!