gatk专题

2024.08.26【BUG报错】|GATK分析之Argument emit-ref-confidence has a bad value解决方案

GATK分析中Argument emit-ref-confidence错误解决方案 在使用GATK(Genome Analysis Toolkit)进行基因组变异分析时,我们可能会遇到一些参数错误,其中之一就是"Argument emit-ref-confidence has a bad value"。这个错误通常与Read Group的设置不当有关。本文将提供一种解决方案,通过正确设置Read

GATK ReadsPathDataSource类介绍

GATK(Genome Analysis Toolkit)是一个广泛使用的基因组分析工具包,它的核心库之一是htsjdk,用于处理高通量测序数据。在GATK中,ReadsPathDataSource类是负责管理和提供读取高通量测序数据文件(如BAM、SAM、CRAM)的类。 常见使用场景 数据加载:在GATK的基因组分析工具链中,ReadsPathDataSource 经常被用来从指定路径加载

GATK Mutect2类介绍

GATK 的 Mutect2 是一个用于检测体细胞变异(somatic mutations)的工具,主要用于癌症研究。体细胞变异是指在个体发育过程中体细胞中发生的 DNA 变化,这些变异不遗传给下一代,但在癌症发展过程中起到重要作用。Mutect2 是 GATK 工具集的一部分,专门设计用于识别这些变异。 Mutect2功能与用途 主要功能包括: 体细胞突变检测:Mutect2 可以检测癌

使用WDL执行GATK HaplotypeCaller教程

Introduction 这里的workflow叫做helloHaplotypeCaller;包含一个单任务即是GATK’s HaplotypeCaller。这个task输入一个file inputBAM,输入一个file rawVCF。 Workflow 在workflow里,我们会执行task并指定task的执行顺序。 workflow helloHaplotypeCaller {

GATK Cromwell +WDL学习

WDL (一个workflow description language)+ Cromwell(an execution engine that can run WDL scripts)是目前可以更好使用GATK的一套工具。这里学习wdl的快速入门教程。 我这里使用sublime text3,因此设置新的wdl对应的高亮。根据package control 下载package control包。

GATK Germline Best Practice学习

数据是sporadic的慢病case-control的组合。想用GATK germline best practice的方法进行突变的分析。这里主要参考GATK Germline best practice的教程。1 这里用的是GATK3.7的版本,目前已经出到GATK3.8。最近4.0也发布了。 部分步骤后续补完。。。 Map to Reference bwa mem -t 8

开箱即用版本 满分室间质评之GATK Somatic SNV+Indel+CNV+SV

最近准备为sliverworkspace 图形化生信平台开发报告设计器,需要一个较为复杂的pipeline作为测试数据,就想起来把之前的 满分室间质评之GATK Somatic SNV+Indel+CNV+SV(下)性能优化翻出来用一下。跑了一遍发现还是各种问题,于是想把pipeline改造成免部署、首次运行初始化环境的版本,以便需要时候能够直接运行起来,于是有了本文。 一句话描述就是:开箱即用

开箱即用版本 满分室间质评之GATK Somatic SNV+Indel+CNV+SV

最近准备为sliverworkspace 图形化生信平台开发报告设计器,需要一个较为复杂的pipeline作为测试数据,就想起来把之前的 满分室间质评之GATK Somatic SNV+Indel+CNV+SV(下)性能优化翻出来用一下。跑了一遍发现还是各种问题,于是想把pipeline改造成免部署、首次运行初始化环境的版本,以便需要时候能够直接运行起来,于是有了本文。 一句话描述就是:开箱即用