Nature--迁移学习使得基因互作网络预测成为可能

2023-10-18 09:10

本文主要是介绍Nature--迁移学习使得基因互作网络预测成为可能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

绘制驱动疾病进展的基因调控网络,可以筛选出针对疾病的核心调控基因,从而为疾病治疗提供更有效的方法。

2023年5月31日,题为Transfer learning enables predictions in network biology的文章发表于《Nature》。

1aff5e50ee4a01315d0397779bd8c42e.png

摘要

构建基因网络需要利用大量的转录组数据来学习基因之间的相互关系,这限制了基因网络在数据有限的情形下的应用,包括罕见病和难以获取的组织的疾病等。近来,迁移学习(transfer learning)为自然语言理解、计算机视觉等领域带来了彻底的变革。迁移学习通过有限的任务特异性数据对已在大规模常规数据集上预训练的深度学习模型进行微调,从而使其能够应用于大量的下游任务。在此,我们开发了一个基于注意力机制的上下文感知的深度学习模型Geneformer。Geneformer利用大约3000万个单个细胞转录组构成的大规模语料库进行了预训练,以在有限数据情形下实现下游网络生物学任务的预测。在预训练过程中,Geneformer 对网络动态学获得了基本的理解,可通过完全自监督的方式在模型的注意力权重中编码网络层次结构。在向一个涉及染色质和网络动态的多样的下游任务进行微调时,在有限的任务特异性数据下证明 Geneformer持续提高了预测准确度。在有限患者数据的疾病建模的应用中,Geneformer鉴定了心肌病的候选治疗靶点。总体而言,Geneformer代表了一个预训练的深度学习模型,可通过微调适应广泛的下游应用,进一步促进对关键网络调节因子和候选治疗靶点的发现。

5dbb64f14304205f2d15ef71fc124295.png

图1 Geneformer架构与迁移学习策略 a 描述了迁移学习的流程图;b展示了3000万转录组数据的组织分布;c展示了预训练的Geneformer架构。

讨论

研究人员开发了一种基于深度学习的、对上下文敏感的模型—Geneformer,该模型通过大规模转录组数据的预训练,可以在数据有限的场景中进行预测。在预训练过程中通过观察大量的细胞状态,Geneformer对网络动力学有了基本的理解,并以完全自监督的方式在模型的注意力权重中编码网络层次结构。Geneformer通过对上下文敏感的计算模拟删除方法预测剂量敏感疾病基因的能力,为遗传变异的解释提供了宝贵的资产,包括对驱动复杂性状的GWAS靶点进行优先排序,并预测它们可能影响的特定组织。在胎儿心肌细胞中验证剂量敏感基因候选者TEAD4的实验结果支持了Geneformer在推动人类发育生物学深入研究方面具有重要的作用。

63f8fd1e9c9000f3e47855ba1c0bb7dd.png

图2 使用有限的数据,Geneformer提高了基因剂量敏感性的预测能力。

在使用有限的患者样本进行心肌病疾病模型建模时,Geneformer预测了候选治疗靶点,并在iPSC疾病模型中进行实验性验证,结果发现CRISPR介导的iPSC衍生的心脏微组织中候选TEAD4的敲除导致其产生收缩应力(单位面积的力)的能力显著降低(如图2 e所示)。

因此,使用有限数据进行计算模拟治疗分析可能有助于发现以往受到数据限制而受阻的罕见疾病或影响临床难以获取组织的疾病的治疗方法。此外,我们发现,使用更大、更多样化的语料库进行预训练可以持续提高Geneformer的预测能力。此外,在预训练过程中接触数百个实验数据集似乎也有助于提高易受批次效应和个体差异影响的单细胞分析的稳定性。这些发现表明,随着公开可用的转录组数据量不断扩大,未来基于更大规模语料库的预训练模型可能会为实现更多难以探索的研究提供有意义的预测。

阅读原文内容:

https://www.nature.com/articles/s41586-023-06139-9

往期精品(点击图片直达文字对应教程)

b7091f64a81e158b557f5031064b9ca6.jpeg

9a3588ecb7d799ef2f0b2bfb8039ac9c.jpeg

c02a553254d975cd9a34a03919a0b8f5.jpeg

74228e2194468240f7f1d599b8c68981.jpeg

9750afe65bb3dc8d64304753ef8284b6.jpeg

d3f97e9caad4add4282840074ac98e91.jpeg

1f6ac50188fded054a06fdcc41237d3a.jpeg

6867ff490ac56927b8e0a9776f996839.jpeg

98fa42eb0c668f7a009c9ce9c11c9fbd.jpeg

deaf80064d24443cad45a75a589f39b4.jpeg

cf92497b8102997712fba20f91a3a241.jpeg

1adac8300f4d3fe959271d4819e9d457.jpeg

1e426451081a59d7d210e5752aace3ed.png

2ddffebc9fb7ec70a465a7c3a9190fab.png

b24ba6e4c2cc1c2fcae5ae0bf67951d8.png

1ece0e6a810e237bd3c7da99fcf89092.png

3c12e9690d75af2b682dff9f083eea82.jpeg

d3f8d42810fc8769851c9238c5c13322.jpeg

03f5daa031fe58a89135e7ae9eb697ae.jpeg

3f1b07ba3ab3c4f1f175ec5f7f0fc9b7.jpeg

4876f3dbe72a668d60fa72e72853de0b.png

bd019a1518ce65cb779fc0adc5eceb5c.png

b7233a89282e8740a70a9d6c62689685.jpeg

1262ddf5bf3d146e0425798d93bc5b6d.png

95a092f3db2c8ea60fc7a2c5261dec37.png

83a5d42417f2d3bad251d2a18c6d7a65.jpeg

597e46ed8fd4681968cd1f6849d5cf12.png

a82dd2b8f2e3e805d07ecbf1313d5eab.png

机器学习

06221bdfa244ca45b36f1b793557dff1.png

838a838df45363ae850c69739b87c86d.jpeg

9251ada703398cec140c19492bd4886c.jpeg

2638a8f6120703a869dd45189e8b71be.png

这篇关于Nature--迁移学习使得基因互作网络预测成为可能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/231623

相关文章

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

浅谈mysql的sql_mode可能会限制你的查询

《浅谈mysql的sql_mode可能会限制你的查询》本文主要介绍了浅谈mysql的sql_mode可能会限制你的查询,这个问题主要说明的是,我们写的sql查询语句违背了聚合函数groupby的规则... 目录场景:问题描述原因分析:解决方案:第一种:修改后,只有当前生效,若是mysql服务重启,就会失效;

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创