本文主要是介绍GTF基因注释文件详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
GFF和GTF是两种最常用的数据库注释格式,在信息分析中建库时除了需要fasta文件一般还会需要这两种文件,提取需要的信息进行注释。Cufflinks/Tophat 软件需要 GTF文件作为基因注释文件。
GFF全称为general feature format,这种格式主要是用来注释基因组。
GTF全称为gene transfer format,主要是用来对基因进行注释。
目前两种文件可以方便的相互转化,比如:使用Cufflinks软件的 的gffread。
GTF文件由9列数据组成,这两种文件的前8列都是相同的(一些小的差别),
gtf文件是以tab键分割的9列组成,以下为每一列的对应信息:
seq_id |
这篇关于GTF基因注释文件详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!