基因型专题

【plink】如何把基因型数据ATCG格式转换为012之一 --recodeA

plink官网:Data management - PLINK 1.9 命令:将基因型数据转化为012的raw格式 plink --file DD --recodeA --out DD_test_A#结果文件 DD_test_A.raw 查看具体说明: --recodeA  : snp的major变为了0, snp的minor变为了2, 杂合变为了1. 具体查看: pli

vcf样本基因型提取--PyVCF处理

需要提取vcf文件的样本基因型,原始文件: 代码: import vcfvcf_reader = vcf.Reader(filename=r"I:/1000GenomeProject/vcftools_filter/chr22_filter.recode.vcf")genomeType=[]for record in vcf_reader:# 样本个数# print(record._sam

基因型填充前的质控条件简介

欢迎关注”生信修炼手册”! 影响基因型填充准确率的因素有很多,比如分型结果的质量,填充软件的选择,reference panel的选择,样本量的大小, SNP的密度等等。 为了提高填充的准确率,我们需要在填充前进行质量过滤。对于原始的分型结果,可以根据一些条件进行筛选和过滤,得到高质量的分型结果,用于后续的填充。 分型结果本质上是一张由样本和SNP位点构成的表格,对应的过滤手段也分成了两个大的方

使用Minimac进行基因型填充

欢迎关注”生信修炼手册”! Minimac是一款经典的基因型填充软件,该软件也是以内存消耗小,运行速度快而著称,历经了MaCH, minimac, minimac2, minmac3多个版本的更新换代,目前最新版本为v4, 网址如下 https://genome.sph.umich.edu/wiki/Minimac4 源代码保存在github上,网址如下 https://github.co