HLAreporter : HLA分型软件简介

2023-10-12 02:50

本文主要是介绍HLAreporter : HLA分型软件简介,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注"生信修炼手册"

在前面的文章中,我们详细介绍了HLA Allel的命名格式,示意图如下

从示意图可以看出,一个HLA Allel 可以分成四个字段,在加上最后的修饰后缀,共5个字段;在定义HLA 分型结果的分辨率时,会根据分型结果的最大位数来判断,如果只给出了字段一,即血清学分类的信息,代表是2位的分型结果;如果最多给出了字段二,即对应的蛋白信息,代表是4位的分型结果;如果最多给出了字段三,即CDS区信息,代表是8位的分型结果;如果分型结果给出了最后的后缀,代表是9位的分型结果。

HLA分型的技术手段很多,比如芯片,高通量测序等;不同手段识别到的HLA Allel 分辨率不同,如果只能给出2位的分型结果,则属于低分辨率;如果给出4位分型结果,属于中分辨率;能够给出8位或以上分型结果,属于高分辨率。

本篇文章主要介绍HLA  reporter 软件,该软件可以利用高通量测序的结果进行HLA 分型。其分型结果分辨率高,最多可到9位。下图是该软件与其他同类软件的比较结果

可以看到,在测试样本中,HLAreporter 软件分型结果由于HLAminer 的结果。该截图来自于官方文献,链接如下

https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-015-0145-3

软件的官网如下

http://paed.hku.hk/genome/software.html

安装过程如下

wget http://paed.hku.hk/genome/software/HLAreporter.zip
unzip HLAreporter.zip
cd HLAreporter.v103

HLAreporter.sh就是该软件的运行脚本。其原理如下

由于HLA的多态性,直接比对reads到参考基因组是不行的 ,HLAreporter 设计了一个CRP(comprehensive reference panel)参考基因组 , CRP 构建时参考了IMGT/HLA 数据库中已知的HLA  Allel信息,通过bwa将reads与CRP比对,提取比对到某个HLA基因的reads,然后进行组装,将组装的contig与数据库比较,确定最终的Allel。

该软件的用法如下

bash HLAreporter.sh test HLA_B test.R1.fq test.R2.fq

第一个参数test代表样本名称;第二个参数代表检测的HLA基因,第三个和第四个参数代表双端测序的fastq序列。

整个pipeline 分成了3个部分

1. bwa 比对 CRP 数据库

当你提供了原始的fastq 数据时,会自动调用4digit_map_HLA.sh脚本进行比对
该脚本核心内容如下

bwa aln exon23_high_resolution_multi_ref.fa $1 > $3_1_exon23_high_resolution_multi_ref.sai
bwa aln exon23_high_resolution_multi_ref.fa $2 > $3_2_exon23_high_resolution_multi_ref.sai
bwa sampe exon23_high_resolution_multi_ref.fa $3_1_exon23_high_resolution_multi_ref.sai $3_2_exon23_high_resolution_multi_ref.sai $1 $2 > $3_exon23_high_resolution_multi_ref.sam
samtools view -bS $3_exon23_high_resolution_multi_ref.sam > $3_exon23_high_resolution_multi_ref.bam
samtools view -b -F 4 $3_exon23_high_resolution_multi_ref.bam > $3_exon23_high_resolution_multi_ref_mappedreads.bam
samtools sort $3_exon23_high_resolution_multi_ref_mappedreads.bam $3_exon23_high_resolution_multi_ref_mappedreads_sorted
samtools index $3_exon23_high_resolution_multi_ref_mappedreads_sorted.bam

$1$2分别对应双端测序的R1和R2端reads, $3表示样本名称,通过调用bwa sampe,将原始的双端reads与exon23_high_resolution_multi_ref.fa比对,生成exon23_high_resolution_multi_ref_mappedreads_sorted.bam 文件。

2. 识别HLA Allel

对于HLA-A , HLA-B, HLA-C 这三个I型基因而言,调用4digit_predict_classI_ssake.sh脚本;对于HLA II 型基因,调用4digit_predict_classII_main.sh脚本。

3. 给出Allel 在不同人群中的频率

利用ANFD数据库中的信息,给出每个Allel在不同人群中的频率,通过脚本HLAfreq.sh实现。

最终输出结果保存在results目录下,示意如下

------------------------------------------------------------------
HLAreporter version 1.03
Report created
Fri Apr 17 11:24:24 HKT 2015
------------------------------------------------------------------
AlleleDRB1*01:01:01G
AlleleDRB1*04:07:01G
PhaseDRB1*04:08:01
Alleles detected
DRB1*01:01:01G
DRB1*01:17
DRB1*04:08:01
DRB1*04:07:01G
Gap location:
97    208
Non-polymorphic gap:
111 bp
HLA data quality profile:
10xcov%    100    20xcov%    100    30xcov%    97    50xcov%    89
------------------------------------------------------------------
HLA allele frequency
Four populations in Europe China Japan Africa are shown
By allele frequency net database (www.allelefrequencies.net)
------------------------------------------------------------------
[Allele]    [EUR]    [CHN]    [JPN]    [AFR]
DRB1*01:01    0.0860    0.0230    0.0582    0.0130
DRB1*04:07    0.0112    0.0030    0.0057    0.0030
DRB1*04:08    0.0039    0.0020    0.0000    0.0000
DRB1*01:17    0.0000    0.0000    0.0000    0.0000

HLAreporter目前只支持对以下11个基因的分型

  1. HLA_A

  2. HLA_B

  3. HLA_C

  4. HLA_DRB1

  5. HLA_DRB2

  6. HLA_DRB3

  7. HLA_DRB4

  8. HLA_DRB5

  9. HLA_DQB1

  10. HLA_DPB1

  11. HLA_DQA1

扫描关注微信号,更多精彩内容等着你!

这篇关于HLAreporter : HLA分型软件简介的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/192708

相关文章

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

【STM32】SPI通信-软件与硬件读写SPI

SPI通信-软件与硬件读写SPI 软件SPI一、SPI通信协议1、SPI通信2、硬件电路3、移位示意图4、SPI时序基本单元(1)开始通信和结束通信(2)模式0---用的最多(3)模式1(4)模式2(5)模式3 5、SPI时序(1)写使能(2)指定地址写(3)指定地址读 二、W25Q64模块介绍1、W25Q64简介2、硬件电路3、W25Q64框图4、Flash操作注意事项软件SPI读写W2

业务协同平台--简介

一、使用场景         1.多个系统统一在业务协同平台定义协同策略,由业务协同平台代替人工完成一系列的单据录入         2.同时业务协同平台将执行任务推送给pda、pad等执行终端,通知各人员、设备进行作业执行         3.作业过程中,可设置完成时间预警、作业节点通知,时刻了解作业进程         4.做完再给你做过程分析,给出优化建议         就问你这一套下

免费也能高质量!2024年免费录屏软件深度对比评测

我公司因为客户覆盖面广的原因经常会开远程会议,有时候说的内容比较广需要引用多份的数据,我记录起来有一定难度,所以一般都用录屏工具来记录会议内容。这次我们来一起探索有什么免费录屏工具可以提高我们的工作效率吧。 1.福晰录屏大师 链接直达:https://www.foxitsoftware.cn/REC/  录屏软件录屏功能就是本职,这款录屏工具在录屏模式上提供了多种选项,可以选择屏幕录制、窗口

容器编排平台Kubernetes简介

目录 什么是K8s 为什么需要K8s 什么是容器(Contianer) K8s能做什么? K8s的架构原理  控制平面(Control plane)         kube-apiserver         etcd         kube-scheduler         kube-controller-manager         cloud-controlle

HomeBank:开源免费的个人财务管理软件

在个人财务管理领域,找到一个既免费又开源的解决方案并非易事。HomeBank 正是这样一个项目,它不仅提供了强大的功能,还拥有一个活跃的社区,不断推动其发展和完善。 开源免费:HomeBank 是一个完全开源的项目,用户可以自由地使用、修改和分发。用户友好的界面:提供直观的图形用户界面,使得非技术用户也能轻松上手。数据导入支持:支持从 Quicken、Microsoft Money

【Tools】AutoML简介

摇来摇去摇碎点点的金黄 伸手牵来一片梦的霞光 南方的小巷推开多情的门窗 年轻和我们歌唱 摇来摇去摇着温柔的阳光 轻轻托起一件梦的衣裳 古老的都市每天都改变模样                      🎵 方芳《摇太阳》 AutoML(自动机器学习)是一种使用机器学习技术来自动化机器学习任务的方法。在大模型中的AutoML是指在大型数据集上使用自动化机器学习技术进行模型训练和优化。

PDF 软件如何帮助您编辑、转换和保护文件。

如何找到最好的 PDF 编辑器。 无论您是在为您的企业寻找更高效的 PDF 解决方案,还是尝试组织和编辑主文档,PDF 编辑器都可以在一个地方提供您需要的所有工具。市面上有很多 PDF 编辑器 — 在决定哪个最适合您时,请考虑这些因素。 1. 确定您的 PDF 文档软件需求。 不同的 PDF 文档软件程序可以具有不同的功能,因此在决定哪个是最适合您的 PDF 软件之前,请花点时间评估您的

梳理2024年,螺丝钉们爱用的3款剪辑软件

这年头,视频到处都是,就跟天上的星星一样数不清。不管你是公司里的新面孔,还是职场上的老狐狸,学会怎么剪视频,就好比找到了赢的秘诀。不管是给上司汇报工作,展示你的产品,还是自己搞点小视频记录生活,只要是剪辑得漂亮,肯定能一下子吸引大家的目光,让人记得你。咱们今天就来侃侃现在超火的三款视频剪辑工具,尤其是PR剪辑,你肯定听说过,这货在剪辑界可是大名鼎鼎,用它剪视频,既专业又麻利。 NO1. 福昕轻松