clinvar专题

OKK---生物信息研究之ClinVar的下载,Annovar的下载和使用

ClinVar数据库中记录了大量的人类变体,和这些变体导致的致病或健康或无意义,所以要使用机器学习来做一个错义变体的研究需要使用带这个数据集 从NCBI官网上下载的话可以下载相应的变体,但问题是不是VCF格式,我们需要使用annovar这个注释软件对变体进行注释。 何为注释,获得变体的额外信息,用这些结构化的额外信息来作为输入。 ClinVar数据库的学习和解读可以参考----12--人类遗

生信技能40 - Clinvar数据库VCF文件下载和关键信息提取

Clinvar 下载VCF文件 # 后台下载最新版本VCFwget -c -b https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20240301.vcf.gz# 解压gzip -d clinvar_20240301.vcf.gz 读取Clinvar VCF文件 # vcf文件路径clinvar_vcf = "cl