Nature--迁移学习使得基因互作网络预测成为可能

2023-10-18 09:10

本文主要是介绍Nature--迁移学习使得基因互作网络预测成为可能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

绘制驱动疾病进展的基因调控网络,可以筛选出针对疾病的核心调控基因,从而为疾病治疗提供更有效的方法。

2023年5月31日,题为Transfer learning enables predictions in network biology的文章发表于《Nature》。

1aff5e50ee4a01315d0397779bd8c42e.png

摘要

构建基因网络需要利用大量的转录组数据来学习基因之间的相互关系,这限制了基因网络在数据有限的情形下的应用,包括罕见病和难以获取的组织的疾病等。近来,迁移学习(transfer learning)为自然语言理解、计算机视觉等领域带来了彻底的变革。迁移学习通过有限的任务特异性数据对已在大规模常规数据集上预训练的深度学习模型进行微调,从而使其能够应用于大量的下游任务。在此,我们开发了一个基于注意力机制的上下文感知的深度学习模型Geneformer。Geneformer利用大约3000万个单个细胞转录组构成的大规模语料库进行了预训练,以在有限数据情形下实现下游网络生物学任务的预测。在预训练过程中,Geneformer 对网络动态学获得了基本的理解,可通过完全自监督的方式在模型的注意力权重中编码网络层次结构。在向一个涉及染色质和网络动态的多样的下游任务进行微调时,在有限的任务特异性数据下证明 Geneformer持续提高了预测准确度。在有限患者数据的疾病建模的应用中,Geneformer鉴定了心肌病的候选治疗靶点。总体而言,Geneformer代表了一个预训练的深度学习模型,可通过微调适应广泛的下游应用,进一步促进对关键网络调节因子和候选治疗靶点的发现。

5dbb64f14304205f2d15ef71fc124295.png

图1 Geneformer架构与迁移学习策略 a 描述了迁移学习的流程图;b展示了3000万转录组数据的组织分布;c展示了预训练的Geneformer架构。

讨论

研究人员开发了一种基于深度学习的、对上下文敏感的模型—Geneformer,该模型通过大规模转录组数据的预训练,可以在数据有限的场景中进行预测。在预训练过程中通过观察大量的细胞状态,Geneformer对网络动力学有了基本的理解,并以完全自监督的方式在模型的注意力权重中编码网络层次结构。Geneformer通过对上下文敏感的计算模拟删除方法预测剂量敏感疾病基因的能力,为遗传变异的解释提供了宝贵的资产,包括对驱动复杂性状的GWAS靶点进行优先排序,并预测它们可能影响的特定组织。在胎儿心肌细胞中验证剂量敏感基因候选者TEAD4的实验结果支持了Geneformer在推动人类发育生物学深入研究方面具有重要的作用。

63f8fd1e9c9000f3e47855ba1c0bb7dd.png

图2 使用有限的数据,Geneformer提高了基因剂量敏感性的预测能力。

在使用有限的患者样本进行心肌病疾病模型建模时,Geneformer预测了候选治疗靶点,并在iPSC疾病模型中进行实验性验证,结果发现CRISPR介导的iPSC衍生的心脏微组织中候选TEAD4的敲除导致其产生收缩应力(单位面积的力)的能力显著降低(如图2 e所示)。

因此,使用有限数据进行计算模拟治疗分析可能有助于发现以往受到数据限制而受阻的罕见疾病或影响临床难以获取组织的疾病的治疗方法。此外,我们发现,使用更大、更多样化的语料库进行预训练可以持续提高Geneformer的预测能力。此外,在预训练过程中接触数百个实验数据集似乎也有助于提高易受批次效应和个体差异影响的单细胞分析的稳定性。这些发现表明,随着公开可用的转录组数据量不断扩大,未来基于更大规模语料库的预训练模型可能会为实现更多难以探索的研究提供有意义的预测。

阅读原文内容:

https://www.nature.com/articles/s41586-023-06139-9

往期精品(点击图片直达文字对应教程)

b7091f64a81e158b557f5031064b9ca6.jpeg

9a3588ecb7d799ef2f0b2bfb8039ac9c.jpeg

c02a553254d975cd9a34a03919a0b8f5.jpeg

74228e2194468240f7f1d599b8c68981.jpeg

9750afe65bb3dc8d64304753ef8284b6.jpeg

d3f97e9caad4add4282840074ac98e91.jpeg

1f6ac50188fded054a06fdcc41237d3a.jpeg

6867ff490ac56927b8e0a9776f996839.jpeg

98fa42eb0c668f7a009c9ce9c11c9fbd.jpeg

deaf80064d24443cad45a75a589f39b4.jpeg

cf92497b8102997712fba20f91a3a241.jpeg

1adac8300f4d3fe959271d4819e9d457.jpeg

1e426451081a59d7d210e5752aace3ed.png

2ddffebc9fb7ec70a465a7c3a9190fab.png

b24ba6e4c2cc1c2fcae5ae0bf67951d8.png

1ece0e6a810e237bd3c7da99fcf89092.png

3c12e9690d75af2b682dff9f083eea82.jpeg

d3f8d42810fc8769851c9238c5c13322.jpeg

03f5daa031fe58a89135e7ae9eb697ae.jpeg

3f1b07ba3ab3c4f1f175ec5f7f0fc9b7.jpeg

4876f3dbe72a668d60fa72e72853de0b.png

bd019a1518ce65cb779fc0adc5eceb5c.png

b7233a89282e8740a70a9d6c62689685.jpeg

1262ddf5bf3d146e0425798d93bc5b6d.png

95a092f3db2c8ea60fc7a2c5261dec37.png

83a5d42417f2d3bad251d2a18c6d7a65.jpeg

597e46ed8fd4681968cd1f6849d5cf12.png

a82dd2b8f2e3e805d07ecbf1313d5eab.png

机器学习

06221bdfa244ca45b36f1b793557dff1.png

838a838df45363ae850c69739b87c86d.jpeg

9251ada703398cec140c19492bd4886c.jpeg

2638a8f6120703a869dd45189e8b71be.png

这篇关于Nature--迁移学习使得基因互作网络预测成为可能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/231623

相关文章

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss