本文主要是介绍重磅|携万人基因组,基因组学先驱Craig Venter再出重拳,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
在研究了10545个基因组之后,我们可以清晰的看到要了解超过70亿全球人口的DNA序列的所有变异,我们还有很长的路要走。某些变异和种族相关,另外一些则是单体突变的结果。即使是基因组的长度也因人而异,稍有不同。
随着越来越多的基因组被测序,并关联到个人健康数据,基因组信息的价值也越来越大。这在寻找罕见疾病的遗传原因方面尤为重要。
虽然研究尚未发表在同行评审期刊,读过此文的一些科学家已经赞誉有加,并期待它正式出版。此出版前版本可以在这儿找到:http://bit.ly/jcvideep。
以下是该研究报告的几个亮点:
--- 个人基因组的84%可以自信测序。这其中包含了已知的致病变异的92.5%左右。
--- 每个新测序的基因组中平均包含了8,579个以前未知的变异,这些变异与疾病或关联,或无关。
--- 此外,每个基因组包含大约70万个DNA“字母”没有在标准对照基因组中发现。
“我们的工作是到目前为止,按照新标准深度测序人类基因的一项最大的研究,”研究报告称,“这项研究找到并确定了超过1.5亿的人类基因组的突变,其中大部分是未知的或稀有突变。
“而且,这些数据帮我们找出基因组的高度不耐受变异位点 - 这些位点对生命或健康可能是至关重要的。我们的结论是:深度基因组测序提供了科研和临床应用的人类基因变异准确的细节。“
位于La Jolla的人类长寿公司(HumanLongevity Inc)和非营利的J. Craig Venter研究所的科学家进行了这项研究。文特尔是资深作者。第一作者是Amalio Telenti,Levi C.T. Pierce and WilliamH. Biggs, 都来自人类长寿公司。
这项研究发表在7月1日的BioRxiv,一个由纽约冷泉港实验室提供的网站。
◆ ◆ ◆
质和量
因为同行评审和出版过程尚未完成, 文特尔博士拒绝了接受采访的请求。但是,读过该研究的其他科学家说,他们留下了深刻印象,因而提供了一个非正式的同行评审。
“哇”,是阿图尔巴特(Atul Butte)博士7月6日读完该文后在Twitter上的反应,巴特博士领导着加州大学旧金山分校计算健康科学研究所的工作。
经进一步联系采访,巴特博士称该研究的规模“令人印象深刻”,基因组的质量也是杠杠的。
在这10,000个基因组中,其中的8096来自不相关的个体,每个基因组都达到了30至40倍的深度测序以减少错误。这种“深度测序”,根据已有研究结果,足够达到医疗级基因组质量,可以临床使用。
一些基因组包含了医学上重要的变异,本研究的数据质量保证了解释变异和疾病间的关联性, 巴特博士说。并且,相关基因是放在一起进行研究的。
“我喜欢他们对基因家族的详细研究,”巴特博士说。 “我认为这是一个非常创新的观点。”
对于临床使用,基因组提供了有益的参考集,变异的详细数据可以用于比较未来个人基因组的变异,巴特博士补充说。
“这将有助于每一个癌症病人的治疗,还可以帮助理解每一个带有罕见遗传病的孩子。”他说。
Hudson Freeze博士是位于La Jolla的SanfordBurnham Prebys(SBP)医学研究所从事稀有遗传病研究的专家,据他称, 文特尔团队的做法类似虚构的电视剧CSI的现实版(译者注:CSI是美国一部研究犯罪情节的系列剧)。
“我们一开始只有一个模糊的画面,如何进一步提升呢?突然间,像更换了牌照一样,一切变得清晰可读。”曾经担任SBP的人类遗传学项目主任的Hudson Freeze博士说。 “这就是他们现在所做的神奇工作。”
◆ ◆ ◆
稀有遗传病
Freeze 博士说,这项研究是他所知道的有史以来第一个科研项目, 以这样高的品质来测序这么多的基因组。高品质高质量的基因组将是研究罕见遗传性疾病的重要依据。
Freeze 博士继续说,这项研究的主要目的和重要前提,是提供个体化医疗,正如在奥巴马总统的精准医学中所倡议的,要求有良好的基因组图谱,准确理解哪些地区的变异可能或不可能影响健康。
“测序超过1万个人的基因组,这样的做法需要很大的勇气,”Freeze说。 “只有像克雷格·文特尔博士这样,有胆有识有钱,才得以完成类似研究。”
Freeze自己的研究是糖基化相关的罕见疾病,属于糖代谢的范畴。他和他的同事还与患者及家属合作,一起寻求某些相关疾病的答案。就在接受采访前,他刚刚处理了一起个案。
“五分钟前,我们刚刚分析了一个未知的基因突变,它引起的疾病可能和我研究的糖代谢有关系。”Freeze说。
在第一个病人,该遗传缺陷是通过功能测试证实的。第二个病人也有一个突变基因,问题是这样的突变基因是否是真正原因,抑或只是虚惊一场。
来自一个罕见疾病数据库中的数据表明该基因有三种突变的存在。突变通常是隐性的,所以如果患者是杂合体,从一个亲本获得突变基因,另一个亲本得到的是正常基因,则不会得病。
“检查过的60000人中有32个突变携带者,”他说。 “但是,这些携带者不会带给你任何其他信息,因为他们都是杂合体。”
第二个病人竟然是纯合子,父母双方都贡献了一个突变的基因副本。
这表明该突变可能是疾病的病因,这就提供了足够的信息用于进行功能性测试以鉴定该罕见疾病。
数量足够多的、高品质的基因组数据将有助于研究人员和临床医生来鉴定这种罕见的遗传性疾病,以缩小病因的可能性,他说。
“如果你没有这种深入的信息,你甚至不知道从哪里开始,”Freeze说。
人类DNA中含有约30亿“字母”组成的序列,这些字母分别是ATGC(代表四种不同的组成DNA的小分子),任何字母的拼写错误可能足以导致一种遗传性疾病,但也可能是无害的。所以基因组测序需要近乎完美的精度,才可以用于临床医疗。
加州大学旧金山分校的Butte教授说,个体基因组的16%无法可靠测序,这并不奇怪。基因组的某些区域,由于其重复性太高,很难测序。
短枪法(Shortgun Sequencing)测序示意
人类基因组太大,不可能一次性读取。由文特尔博士倡导的“短枪”法因此诞生,基因组被分解成许多块,各个测序,然后由计算机重新组装。而重复序列,如相同形状拼图,有时难以以正确的顺序放置。
最近几年,在圣地亚哥Illumina公司及其他测序公司的努力下,测序成本大幅降低,而测序效率大大提高。这使得Craig Venter得以扩大基因组研究的规模,无论在质量还是数量上。
国际上开始人类基因组测序,也就是众多周知的人类基因组计划,始于20世纪80年代末。该计划由美国能源部牵头,共耗资30亿美金。后来,Craig Venter推出了私人资助的类似项目,展开竞争。人类基因组的草图于2001年完成,预示着这个30亿项目的胜利完成。
该计划给大家带来的兴奋点随着时间的变迁而逐渐降低,人们越来越意识到,一个参考基因组说明不了太多问题。参照基因组本身不存在于自然界中,它只是一种抽象。在现实中并不存在这样一个参考基因组。每个人的基因组含有许多变异,而这些变异的大部分的生物意义仍不清楚。
我们也不可能像完成人类基因组计划那样, 来测序每一个单体人类基因,Butte 博士说。
“当你测序新的个体,你不可能像测第一个人类基因组那样,拥有全世界的资源来帮助你,”Butte 博士说。 “因此我想说的是,任何一个好的实验室可能实际上只能得到84%的高质量的基因组序列。”
Ali Torkamani博士是Scripps转化科学研究所基因组信息的主任,他通过电子邮件说,该研究大大加深了我们对不编码基因组序列的认识。 Ali Torkamani是Venter的人类长寿公司的股东。
在整个基因组中,只有被称为“外显子”的序列才构成基因,并表达转译成蛋白质。其余的基因组序列,或者帮助调节基因,或执行其他关键功能。
“这项研究为基因组中所有潜在的临床重要区域提供了更完整的画面,这些区域往往不耐受变异。”Torkamani说。
这项研究的最大限制,至少针对广大读者及外部研究人员来说,是缺乏临床健康数据,Torkamani认为。
对于后续研究,Torkamani建议研究人员进一步检查单核苷酸多态性变异(单点变异,SNP)之外的其他基因组变异。
“虽然SNP是人类基因组遗传变异中最丰富的变异类型,还有其他类型的临床相关变异在本研究中没有讨论 - 尤其是插入,缺失,拷贝数变异,和其他类型的结构变异等。“Torkamani说。
“后续研究这些其他类型的遗传变异将是非常有趣的,将遗传变异与临床表型数据更好的结合起来,也将是一个有趣的跟进。”
原文发布时间为:2016-07-31
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号
这篇关于重磅|携万人基因组,基因组学先驱Craig Venter再出重拳的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!