外显子测序wes

2024-04-22 20:04
文章标签 测序 外显子 wes

本文主要是介绍外显子测序wes,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

外显子是基因组中能够转录组出成熟RNA的部分。一个基因组中所有外显子的集合,即为外显子组。值得注意的是,通常所说的全外显子组测序,是指针对蛋白编码基因的外显子,很少涉及非编码基因。

基因(gene)是DNA中含有特定遗传信息的一段核苷酸序列的总称,是具有遗传效应的DNA分子片段,是控制生物性状的基本遗传单位。人类基因区间的大小可从数百个bp至超过200万个bp不等。根据人类基因组计划(The Human Genome Project)估计,人类拥有20000-25000个蛋白编码基因。

基因组(genome)指一个生物体所包含DNA的全部遗传信息。基因组由基因区域和非编码区域组成。人类的基因组大小约为30亿个碱基对(bp)(3GB),其中非编码区域占到绝大多数,编码蛋白质的区域仅占约2%左右。

外显子组(exome)是基因组中所有外显子的集合。人类拥有约18万个外显子,约占人类基因组的1%,即约3000万个bp(30MB)。

图:蛋白编码基因由内含子(非编码序列)和外显子(包括编码序列以及UTR区域)组成。要翻译有功能的蛋白,要进行以下步骤:基因从DNA转录为RNA前体,通过剪接形成成熟RNA,成熟RNA序列翻译成氨基酸链,以及蛋白质分子的翻译后修饰。

关于外显子,需要注意的一个特殊情况是非翻译区(UTR)。在mRNA的两侧分别存在5'UTR(前导序列)和3'UTR(尾部序列),它们的作用分别是调控翻译的启动和终止。它们由外显子序列构成,但不会被翻译成氨基酸。 所以,并非所有外显子序列都会被翻译成氨基酸。

图:信使RNA前体(pre-mRNA)中的外显子。外显子既包括编码氨基酸的序列(红色),也包括不被翻译的序列(灰色)。

对外显子组(基因组里的所有外显子)进行测序的方法,即为 全外显子组测序 (Whole-Exome Sequencing,WES),也称为 外显子组测序、全外显子测序,全外测序 等。

全基因组测序(Whole-Genome Sequencing, WGS)是对整个基因组进行测序。靶向测序(Targeted-sequencing,也称Panel sequencing)是对选定的基因进行测序,通常有几十个至一千个基因不等。因而,从覆盖基因组的范围来说,全基因组测序>全外显子组测序>靶向测序。

全外测序可以视作一种特殊的靶向测序——它靶向的区域是基因组上的所有外显子。

panel测序有两种技术原理:杂交捕获测序和多重扩增子测序。全外是基于序列杂交原理实现的

需要特别说明的是对CNV的检测。使用全外检测CNV时,在杂交捕获过程中,由于各个外显子的杂交效率不同,故不同外显子的覆盖率差异会较大。当出现阳性结果时,无法判断是由于杂交未捕获到,还是由于缺失。 故使用全外检测CNV容易出现假阳性结果。一般情况下,全外测序不用于CNV的检测 ,但在癌症研究中,利用癌组织和癌旁组织对照,可以检测体细胞CNV。

人类全外显子组所占基因组比例不超过2%,但它包含了约85%与疾病相关的变异,因此在研究编码基因变异层面,全外测序是比全基因组测序更为经济高效的替代方法。全外测序适用于孟德尔疾病、肿瘤、复杂疾病等多个研究领域。对于表现出异质性的疾病,或者患者表现出多个系统受累的复杂疾病症状时,尤为适合使用全外测序。

例如在肿瘤临床检测中,寻求肺癌靶向治疗的患者通常会先做panel测序,因为与肺癌靶向治疗相关的基因是比较明确的,几十至一百多个基因的panel测序通常就可以满足需求。而对于寻求免疫治疗的患者,通常会使用全外或大panel测序,来评估肿瘤突变负荷(Tumor Mutational Burden, TMB),TMB高的患者通常对免疫治疗有更好的响应。全外测序是业内公认的评估TMB的金标准。

WES检测流程

一个WES测序的工作流程,大体可以分为这3个部分:文库制备,测序,生信分析。

文库制备通常包含这些步骤:样本处理,DNA提取,定量,建库,杂交捕获,扩增,质控。

测序,目前的仪器包括国外Illumina公司测序平台,以及华大智造国产测序平台等。

生信分析的流程通常包含这些步骤:质控,拼接比对,去重和重排,变异检测,降噪和过滤,注释等。常用的软件有FastQC,BWA,GATK,ANNOVAR等。

一个完整的全外显子组测序,从样本处理到完成数据分析,通常需要10天左右时间。

来源:

全外测序(WES) - 知乎

这篇关于外显子测序wes的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/926729

相关文章

杨树84K品种的单细胞测序发现转录因子PagMYB31的功能-文献精读44

Transcription factor PagMYB31 positively regulates cambium activity and negatively regulates xylem development in poplar 转录因子PagMYB31正向调控杨树84K品种的形成层活动,并负向调控木质部的发育。 同样有篇文献,二倍体毛白杨基因组~ 二倍体毛白杨(Populus

全外显子测序分析流程3 - Exon.Interval.bed文件生成和BAM文件标记重复

全外显子测序分析流程3 - Exon.Interval.bed文件生成和BAM文件标记重复 分析流程步骤其他相关文章: Python处理生信分析流程配置文件4种方法 全外显子测序分析流程1 - Fastq质控与去接头、低质量和引物序列 全外显子测序分析流程2 - BWA-MEM比对到参考基因组与BAM统计 1. 封装流程特点 python封装, 参数控制配置文件设置核心参数,便于全流程

测序界的第一次

第一个被测序的全基因组:X174噬菌体  1977 第一个被测序的爬行动物基因组:北美绿色安乐蜥(Anolis carolinensis) 2011 第一个被测序的藻类基因组:超小型原始红藻(Cyanidioschyzon merolae) 2004 第一个被测序的多细胞生物: 秀丽隐杆线虫 (Caenorhabditis elegan)

生信技能57 - Samtools获取指定外显子区域depth和提取BAM文件序列

1. Samtools depth 根据指定bed文件,获取指定区域的覆盖度信息。 # 提取IDT xGen V1 HBA1 exon bedcat xgen-exome-hyb-panel-v1-targets-hg19.bed|grep -w HBA1 > hba.exon.bed# 提取HBA1 外显子的覆盖度# -b: 提取depth的bed文件samtools depth -b

简化基因组的测序方法

RAD-Seq(restriction site-associated DNA sequencing)最开始指的是2008年发表在PLOS ONE上“Rapid SNP discovery and genetic mapping using sequenced RAD markers"提出的方法,目前该文章的引用已经达到1200+,现在指代的是一系列基于限制性内切酶的测序技术。同样在概念上被引申的

biostar handbook|如何模拟NGS测序结果

如何用软件模拟NGS数据 为了评价一个工具的性能,通常我们都需要先模拟一批数据。这样相当于有了参考答案,才能检查工具的实际表现情况。因此对于我们而言,面对一个新的功能,可以先用模拟的数据测试下不同工具的优缺点。有如下几个工具值得推荐一下: 'wgsim/dwgsim': 从全基因组中获取测序reads'msbar': EMBOSS其中一个工具,能够从单个序列中模拟随机突变'biosed': E

全外显子测序分析流程1 - Fastq质控与去接头、低质量和引物序列

全外显子测序分析流程1 - Fastq质控与去接头、低质量和引物序列 1. 运行实例 # -d 样本根目录# -s 样本名称python trim_fastq.py -d /result/WES/sample -s sample 2. fastqc质控报告与去接头、低质量序列主程序 对raw fastq和clean fastq生成质控QC报告trim_galore去接头、低质量序列和

Nature Microbiology丨VITA单细菌转录组测序技术助力深入解析奶牛瘤胃微生物组功能异质性

瘤胃微生物组一直以来都是研究相对不足但又极其复杂的微生物生态系统之一。瘤胃微生物能够有效降解植物纤维,将其转化为高质量的蛋白质产品,在这一过程中,由于微生物强烈的发酵,还会产生大量气体,其成分主要包括二氧化碳和甲烷等温室气体,还有少量的氮气和微量的氢气、氧气和硫化氢,这些排放的温室气体甚至会对全球环境造成较大的影响。近些年以来,在宏组学技术的推动下,对瘤胃微生态系统功能的认识已取得了显著进展。然而

易基因:RNA免疫共沉淀测序 (RIP-seq) 技术介绍

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 RIP-seq是将RNA免疫共沉淀(RNA Immunoprecipitation,RIP)与二代测序技术(NGS)相结合以研究细胞内RNA与蛋白互作的技术,RIP利用目标蛋白抗体把相应的RNA-蛋白复合物(RNA Binding Protein,RBP)沉淀下来,然后经过富集和纯化就可以对结合在复合物上的RNA进行测序分析。 R

小RNA的测序技术路线以及分析流程

小RNA(SmallRNA)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Illumina GAiix 能够对样品中的全部Small RNA 进行深度测序,达到定性定量的研究目的。每个样品可得到3 Million 以上的Small RNA 测序序列。通过大量的平行测序,可以发掘、鉴定并定量出任何物种全基因组水平的小RNA 图谱、新miRN