本文主要是介绍使用WDL执行GATK HaplotypeCaller教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Introduction
这里的workflow叫做helloHaplotypeCaller
;包含一个单任务即是GATK’s HaplotypeCaller。这个task输入一个file inputBAM
,输入一个file rawVCF
。
- Workflow
在workflow里,我们会执行task并指定task的执行顺序。
workflow helloHaplotypeCaller {
call haplotypeCaller
}
- Task
例子,比如像GATK RefFasta, sampleName, inputBAM是核心输入。同时GATK会自动寻找支持文件如an index & dictionary for the reference, and an index for the bam:
task haplotypeCaller {
File GATK
File RefFasta
File RefIndex
File RefDict
String sampleName
File inputBAM
File bamIndex
command {
java -jar ${GATK} \
-T HaplotypeCaller \
-R ${RefFasta} \
-I ${inputBAM} \
-o ${sampleName}.raw.indels.snps.vcf
}
output {
File rawVCF = "${sampleName}.raw.indels.snps.vcf"
}
}
- Running the pipeline
先生成input文件:
java -jar wdltool.jar inputs helloHaplotypeCaller.wdl > helloHaplotypeCaller_inputs.json
在input文件填写具体信息,比如:
"workflow.task.variable" : "Type"
改为
"helloHaplotypeCaller.haplotypeCaller.RefFasta" : ".../helloHaplotypeCallerBundle/ref/human_g1k_b37_20.fasta"
执行运行:
java -jar cromwell.jar run helloHaplotypeCaller.wdl -i helloHaplotypeCaller_inputs.json
参考
这篇关于使用WDL执行GATK HaplotypeCaller教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!