Nat Commu | 从人类基因测序直接预测表型:从头设计的全新体系

本文主要是介绍Nat Commu | 从人类基因测序直接预测表型:从头设计的全新体系,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近年来高通量基因测序技术蓬勃发展使得个人基因测序数据爆炸式增加。然而目前基因分析手段仍然以相关性分析为主,系统性预测基因型对表型的影响仍然面临重要挑战,从基因型到表型解读亟须方法上的新突破。

2023年2月17日,英国剑桥医学研究协会分子生物学实验室(Medical Research Council Laboratory of Molecular Biology,MRC-LMB)的Julian Gough 课题组(第一作者:路畅)在Nature Communications 上发表研究论文Hypothesis-free phenotype prediction within a genetics-first framework【1】描述了一个从头设计的全新分析体系Nomaly。不同于当前普遍应用的全基因组扫描强相关性位点的分析方法(比如GWAS),Nomaly通过整合分子生物学、生物信息学的研究结果和合适工具,从个人的基因测序结果对表型异常(可观测或可检测的特征和表型,包含疾病和组织层面的表型)进行直接预测。该分析体系包括从人类基因测序直接预测表型,以及对预测结果进行验证和评判两个主要模块。

e3a4cf3fdd7de050a59e86501eb7aa07.png

以DNA测序结果出发,对组织层面的表型进行直接预测是人类基因密码解读的终极目标。然而直接预测的可行性以及可操作性仍不可知。此项工作花费十余年,创新性地从头设计了预测方法,对个人基因组中的变化进行系统性地整体分析,整合了多层次基因信息流(DNA突变 -> 氨基酸突变 -> 蛋白结构功能影响),整合了多个大型表型数据库注解信息(数万级别的表型和基因已知关系知识),系统性地对表型异常进行量化打分从而获得组织层面的表型预测。Nomaly体系应用到了三个独立数据集上,验证了这种ab initio的表型预测可以达到统计显著,实现对组织或疾病层面表型预测并加以潜在基因解释。Nomaly‘预测+解释’双重能力是相关性分析难以实现的。

文章中的首要数据集是由全世界范围内的已经拥有自己基因测序结果的志愿者组成:志愿者自愿上传他们自己购买的DNA测序结果,基于这些DNA数据进行预测,并基于此产生了关于表型的调查问卷请他们回答。为了建立对来源不同、DNA测序方法不同的上传数据的自动质量控制和处理管线,研究者对近七千完全公开的个人基因数据库(OpenSNP)进行分析,并将研究得到的预处理方法和结果公开【2】。另外,研究人员还在英国最大的患有发育疾病的孩子的数据集(Deciphering Developmental Disease, DDD)【3】上对预测成功率的显著性进行了测试。最后,对参与了全能干细胞项目(Human Induced Pluripotent Stem Cell Initiative, HipSci)【4】的人利用该法进行了细胞层面的表型预测,并通过细胞实验对其中一个与有丝分裂异常的预测结果进行了验证。

该体系中的预测方法以蛋白质的基本结构及功能单位 —— 蛋白结构域为核心建立:利用了经过数十年发展的蛋白结构域数据库(SUPERFAMILY database)【5】,利用了蛋白结构域的隐马尔可夫模型来对基因位点变化导致的氨基酸突变进行打分,并通过蛋白结构域语义注解(功能+表型)数据库(dcGO)【6】将人类基因组中的位点对应至上万种表型。预测体系通过对基因变化导致的功能变化做出差异程度打分,基于差异程度大则可能是相应表型异常的假设,对表型异常进行预测(outlier prediction)。

3ad6d217de0299db5ff5855449de5bb1.png

图注 – 预测方法(Nomaly)简介:以个人DNA测序结果为输入,将其与上千人组成的数据库比较,预测由DNA变化导致的异常表型。

这种通过“从头预测+验证预测显著性”从而获得具有生物意义致病基因解释的体系是基因分析领域的重要进展。在DNA测序方法爆发式发展、数百万人都有了全基因组测序数据的今天,测序结果的分析方法革新呼之欲出,以在这些不断增长的数据资源中更有效地发掘信息、获得更多的具有医疗价值的发现。进一步发展该体系,以及与其他方法进行结合,还将推进个人化精准医疗的研究。

原文链接:

https://doi.org/10.1038/s41467-023-36634-6

制版人:十一  来源:BioArt

参考文献

1. Hypothesis-free phenotype prediction within a genetics-first framework. Lu, C., Zaucha, J., Gam, R., Fang, H., Smithers, B., Oates, ME., Bernabe-Rubio, M., Williams, J., Zelenka, N., Pandurangan, AP., Tandon, H., Shihab, H., Kalaivani, R., Sung, M., Sardar, AJ., Tzovoras, BG., Danovi, D., Gough, J. Nature Communications 14, 919 (2023).

2. Lu, C., Tzovaras, BG. & Gough, J. A survey of direct-to-consumer genotype data, and quality control tool (GenomePrep) for research. Comput Struct Biotechnol J 19, 3747–3754 (2021). (第一作者同时为通讯作者)

3. The DDD Study. Large-scale discovery of novel genetic causes of developmental disorders. Nature 519, 223–228 (2015).

4. Kilpinen, H. et al. Common genetic variation drives molecular heterogeneity in human iPSCs. Nature 546, 370–375 (2017).

5. de Lima Morais, D. A. et al. SUPERFAMILY 1.75 including a domain-centric gene ontology method. Nucleic Acids Res 39, D427–D434 (2011).

6. Fang, H. & Gough, J. dcGO: database of domain-centric ontologies on functions, phenotypes, diseases and more. Nucleic Acids Res 41, D536–D544 (2013).

往期精品(点击图片直达文字对应教程)

ed00125f1cd97ade67f5ccdb55fc8778.jpeg

f65de3aae93833ed744ec361ad36e9ee.jpeg

c494a98c03fd86383d7c0bdc370a34b2.jpeg

4d6ba89a58e8572e6944aa4fcb26745c.jpeg

c1933ad0bdea99241fbe9e28ac9dddc8.jpeg

45a466462859c514d0b0e01d645ae2c8.jpeg

f3c4c2f6fd0b3cf51f1207a709f56881.jpeg

cda238ce0aa7f81dd9e59f567b97d43a.jpeg

5e674a9c58f7a3ff541accb911248f22.jpeg

bba859354ad45713a8d59bbff03eaee5.jpeg

d47506a8d2ef055003f051617c95a65b.jpeg

48844b4cb50bba887129c88e267c3e34.jpeg

f791dfaedf3533614002b1a41566b53b.png

7d7a80904209f9f08352ae87408d104f.png

a04679208f7f7ea5274b6b6b60706746.png

7293817e8cce6621bad35dfe248663cf.png

b8d02fd91a99436a2dee0b6c97efbf1f.jpeg

aedefe740b0a91ecc3acbe1530b008c7.jpeg

d054913d00fdb3526b686eb8323ae751.jpeg

1ac92bb7a1b980020fce50fccde49790.jpeg

b9db01ca8b9555ac0df81f471e5f8462.png

3cf1901f30a62575327ec78d31d5fe85.png

cc957954bf55003bb8d1141cf406b66e.jpeg

56cd882e943ba96b818d585b84fd7c8b.png

7d1beb291d28b9f390d704a26f741c04.png

b3a424c748de577638e62b70797edd87.jpeg

30e00eb081e5b1dc1082837e1940c933.png

124bfd57c5e2e13b983bb151cda687b9.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

08a1bd02e6959654572d7c7eaec126f1.jpeg

5f16dca41a6c100702c1b663545a14f7.jpeg

4102b49850bf0c7ca68149bc9955bd19.png

这篇关于Nat Commu | 从人类基因测序直接预测表型:从头设计的全新体系的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/707336

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

怎么让1台电脑共享给7人同时流畅设计

在当今的创意设计与数字内容生产领域,图形工作站以其强大的计算能力、专业的图形处理能力和稳定的系统性能,成为了众多设计师、动画师、视频编辑师等创意工作者的必备工具。 设计团队面临资源有限,比如只有一台高性能电脑时,如何高效地让七人同时流畅地进行设计工作,便成为了一个亟待解决的问题。 一、硬件升级与配置 1.高性能处理器(CPU):选择多核、高线程的处理器,例如Intel的至强系列或AMD的Ry

基于51单片机的自动转向修复系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 单片机

SprinBoot+Vue网络商城海鲜市场的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质创作者,全网30w+

网络学习-eNSP配置NAT

NAT实现内网和外网互通 #给路由器接口设置IP地址模拟实验环境<Huawei>system-viewEnter system view, return user view with Ctrl+Z.[Huawei]undo info-center enableInfo: Information center is disabled.[Huawei]interface gigabit

单片机毕业设计基于单片机的智能门禁系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍程序代码部分参考 设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

开题报告中的研究方法设计:AI能帮你做什么?

AIPaperGPT,论文写作神器~ https://www.aipapergpt.com/ 大家都准备开题报告了吗?研究方法部分是不是已经让你头疼到抓狂? 别急,这可是大多数人都会遇到的难题!尤其是研究方法设计这一块,选定性还是定量,怎么搞才能符合老师的要求? 每次到这儿,头脑一片空白。 好消息是,现在AI工具火得一塌糊涂,比如ChatGPT,居然能帮你在研究方法这块儿上出点主意。是不

创业者该如何设计公司的股权架构

本文来自七八点联合IT橘子和车库咖啡的一系列关于设计公司股权结构的讲座。 主讲人何德文: 在公司发展的不同阶段,创业者都会面临公司股权架构设计问题: 1.合伙人合伙创业第一天,就会面临股权架构设计问题(合伙人股权设计); 2.公司早期要引入天使资金,会面临股权架构设计问题(天使融资); 3.公司有三五十号人,要激励中层管理与重要技术人员和公司长期走下去,会面临股权架构设计问题(员工股权激

分布式文件系统设计

分布式文件系统是分布式领域的一个基础应用,其中最著名的毫无疑问是 HDFS/GFS。如今该领域已经趋向于成熟,但了解它的设计要点和思想,对我们将来面临类似场景 / 问题时,具有借鉴意义。并且,分布式文件系统并非只有 HDFS/GFS 这一种形态,在它之外,还有其他形态各异、各有千秋的产品形态,对它们的了解,也对扩展我们的视野有所俾益。本文试图分析和思考,在分布式文件系统领域,我们要解决哪些问题、有