MIT-6874-Deep Learning in the Life Sciences Week5

2023-10-08 00:20

本文主要是介绍MIT-6874-Deep Learning in the Life Sciences Week5,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Lecture 6: Regulatory genomicsGene regulation, chromatin accessibility, DNA regulatory code

  • AI在调控组学中应用
    • 1 生物学基础:调控构建块
      • 1.1 基因调控:Cell diversity, Epigenomics, Regulators(TFs), Motifs, Disease role
      • 1.2 Probing gene regulation: TFs/histones: ChIP-seq, Accessibility: DNase/ATAC-seq
    • 2 调控组学和基序发现的传统方法
      • 2.1 基于Enrichment-based基序发现:EM算法、Gibbs Sampling
      • 2.2 基于实验的方法:PBMs,SELEX. Comparative genomics:Evolutionary conservation
    • 在这里插入图片描述
    • 3 卷积神经网络在转录调控中的基础应用
      • 3.1 低维特征:主要想法:pixels<->DNA letters. Patches/filters<->Motifs. Higher<->combinations
      • 3.2 高维特征:学习卷积核<-> Motif discovery. Applying them<-> Motif matches
    • 4 CNNS/RNNs在调控组学中的实际应用:各种架构
      • 4.1 DeepBind: learn motifs, use in(shallow) fully-connected layer, mutations impact
      • 4.2 DeepSea: Train model directly on mutational impact prediction
      • 4.3 Baseet: Multi-task DNase prediction in 164 cell types, reuse/learn motifs
      • 4.4 ChromPuter: Multi-task prediction of different TFs, reuse partner motifs
        • 4.5 DeepLIFT: Model interpretation based on neuron activation properties
    • 5 讲座:斯坦福Anshul Kundaje,Deep Learning for Reg. Genomics
        • BPNet: DNA sequence to base-pair resolution profile regression
        • ChIP-exo/nexus: High resolution TF binding footprints

AI在调控组学中应用

1 生物学基础:调控构建块

1.1 基因调控:Cell diversity, Epigenomics, Regulators(TFs), Motifs, Disease role

基因通过调控,表达不同的细胞类型,从而在人体内产生不同的器官。
DNA packaging的意义:DNA 的高度螺旋化,实现染色质装配的目的
dna通过双螺旋成双链后,与组蛋白结合构成核小体,在通过不断的螺旋和卷曲形成超螺旋体,最后再不短聚集形成染色体/染色质。如果不行成这种高度密集的结构的话所需要的空间就很大,也阻碍了细胞内的各种代谢反应
在这里插入图片描述
(DNA压缩的主要步骤是什么啊? - Ryan的回答 - 知乎
https://www.zhihu.com/question/381570484/answer/1103039550)
在这里插入图片描述
核小体的装配是染色体装配的第一步,DNA包装成核小体,大约压缩了7倍.
染色质以核小体作为基本结构逐步进行包装压缩,经30nm染色质纤维、超螺旋环、最后压缩包装成染色体,总共经过四级包装.
● DNA到核小体
● 从核小体到螺线管(solenoid)
● 从螺线管到超螺线管(supersolenoid)
● 从超螺线管到染色体

DNA在细胞内压缩是非常重要的。DNA内的约147个碱基对loop形成核小体(nucleosome),每个核小体由四个 组蛋白 组成,大概50个核小体组成一个染色质丝(chromatin fiber)

在这里插入图片描述

表观基因组学–体内每个细胞类型的编程方法,通过调整压缩特定的DNA序列启动子区域的特征。

启动子:RNA聚合酶可以结合,并转录DNA的部分。细胞表达开始启动的区域
在这里插入图片描述
转录因子利用DNA结合域识别基因组中的特定DNA序列

在这里插入图片描述
在这里插入图片描述
每个蛋白质都有着不同的结构,蛋白质之间的结合没有像DNA,RNA之间一样的互补性,因此他们需要通过binding motifs

DNA 的表示方法:把所有结合点堆起来,然后建立矩阵,表达DNA的特异性。字母的高度表示信息量
在这里插入图片描述在这里插入图片描述在这里插入图片描述

1.2 Probing gene regulation: TFs/histones: ChIP-seq, Accessibility: DNase/ATAC-seq

  • DNA转录:组蛋白:ChIP-seq
  • DNA可及性(可访问性):一文读懂染色质可及性及ATAC-seq https://zhuanlan.zhihu.com/p/166500744

2 调控组学和基序发现的传统方法

2.1 基于Enrichment-based基序发现:EM算法、Gibbs Sampling

2.2 基于实验的方法:PBMs,SELEX. Comparative genomics:Evolutionary conservation

在这里插入图片描述

3 卷积神经网络在转录调控中的基础应用

在这里插入图片描述

3.1 低维特征:主要想法:pixels<->DNA letters. Patches/filters<->Motifs. Higher<->combinations

将DNA序列表示为一个二维矩阵
在这里插入图片描述
x
修正 = 忽略低于某些阈值的信号。
池化 = 按max或average汇总每个通道。
在这里插入图片描述
将提取到的特征输入到网络中进行预测
在这里插入图片描述

3.2 高维特征:学习卷积核<-> Motif discovery. Applying them<-> Motif matches

在这里插入图片描述
在这里插入图片描述


4 CNNS/RNNs在调控组学中的实际应用:各种架构

4.1 DeepBind: learn motifs, use in(shallow) fully-connected layer, mutations impact

链接: http://www.nature.com/nbt/journal/v33/n8/full/nbt.3300.html
在这里插入图片描述
DeepBind summary

The key deep learning techniques:

  • Convolutional learning
  • Representational learning
  • Back-propagation and stochastic gradient
  • Regularization and dropout
  • Parallel GPU computing especially useful for hyper-parameter search

Limitations in DeepBind:

  • Require defining negative training examples, which is often arbitrary
  • Using observed mutation data only as post-hoc evaluation
  • Modeling each regulatory dataset separately

4.2 DeepSea: Train model directly on mutational impact prediction

在这里插入图片描述

4.3 Baseet: Multi-task DNase prediction in 164 cell types, reuse/learn motifs

Basset: Learning the regulatory code of the accessible genome with deep convolutional neural networks

在这里插入图片描述

4.4 ChromPuter: Multi-task prediction of different TFs, reuse partner motifs

在这里插入图片描述

4.5 DeepLIFT: Model interpretation based on neuron activation properties

在这里插入图片描述


5 讲座:斯坦福Anshul Kundaje,Deep Learning for Reg. Genomics

Deep learning at base-resolution revels cis-regulatory motif syntax

传统的做法:
使用传统测序方法:ATAC-seq / DNase-seq

机器学习方法:
利用转录因子或者染色质的可达性,表达峰值等作为有监督学习的标注
在这里插入图片描述
在这里插入图片描述

BPNet: DNA sequence to base-pair resolution profile regression

在这里插入图片描述

ChIP-exo/nexus: High resolution TF binding footprints

在这里插入图片描述

这篇关于MIT-6874-Deep Learning in the Life Sciences Week5的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/161416

相关文章

简单的Q-learning|小明的一维世界(3)

简单的Q-learning|小明的一维世界(1) 简单的Q-learning|小明的一维世界(2) 一维的加速度世界 这个世界,小明只能控制自己的加速度,并且只能对加速度进行如下三种操作:增加1、减少1、或者不变。所以行动空间为: { u 1 = − 1 , u 2 = 0 , u 3 = 1 } \{u_1=-1, u_2=0, u_3=1\} {u1​=−1,u2​=0,u3​=1}

简单的Q-learning|小明的一维世界(2)

上篇介绍了小明的一维世界模型 、Q-learning的状态空间、行动空间、奖励函数、Q-table、Q table更新公式、以及从Q值导出策略的公式等。最后给出最简单的一维位置世界的Q-learning例子,从给出其状态空间、行动空间、以及稠密与稀疏两种奖励函数的设置方式。下面将继续深入,GO! 一维的速度世界 这个世界,小明只能控制自己的速度,并且只能对速度进行如下三种操作:增加1、减

Deep Ocr

1.圈出内容,文本那里要有内容.然后你保存,并'导出数据集'. 2.找出deep_ocr_recognition_training_workflow.hdev 文件.修改“DatasetFilename := 'Test.hdict'” 310行 write_deep_ocr (DeepOcrHandle, BestModelDeepOCRFilename) 3.推理test.hdev

Open Source, Open Life 第九届中国开源年会论坛征集正式启动

中国开源年会 COSCon 是业界最具影响力的开源盛会之一,由开源社在2015年首次发起,而今年我们将迎来第九届 COSCon! 以其独特定位及日益增加的影响力,COSCon 吸引了越来越多的国内外企业、高校、开源组织/社区的大力支持。与一般企业、IT 媒体、行业协会举办的行业大会不同,COSCon 具有跨组织、跨项目、跨社区的广泛覆盖面,也吸引了众多国内外开源开发者和开源爱好者的关注及参与

Learning Memory-guided Normality for Anomaly Detection——学习记忆引导的常态异常检测

又是一篇在自编码器框架中研究使用记忆模块的论文,可以看做19年的iccv的论文的衍生,在我的博客中对19年iccv这篇论文也做了简单介绍。韩国人写的,应该是吧,这名字听起来就像。 摘要abstract 我们解决异常检测的问题,即检测视频序列中的异常事件。基于卷积神经网络的异常检测方法通常利用代理任务(如重建输入视频帧)来学习描述正常情况的模型,而在训练时看不到异常样本,并在测试时使用重建误

Learning Temporal Regularity in Video Sequences——视频序列的时间规则性学习

Learning Temporal Regularity in Video Sequences CVPR2016 无监督视频异常事件检测早期工作 摘要 由于对“有意义”的定义不明确以及场景混乱,因此在较长的视频序列中感知有意义的活动是一个具有挑战性的问题。我们通过在非常有限的监督下使用多种来源学习常规运动模式的生成模型(称为规律性)来解决此问题。体来说,我们提出了两种基于自动编码器的方法,以

COD论文笔记 Adaptive Guidance Learning for Camouflaged Object Detection

论文的主要动机、现有方法的不足、拟解决的问题、主要贡献和创新点如下: 动机: 论文的核心动机是解决伪装目标检测(COD)中的挑战性任务。伪装目标检测旨在识别和分割那些在视觉上与周围环境高度相似的目标,这对于计算机视觉来说是非常困难的任务。尽管深度学习方法在该领域取得了一定进展,但现有方法仍面临有效分离目标和背景的难题,尤其是在伪装目标与背景特征高度相似的情况下。 现有方法的不足之处: 过于

One-Shot Imitation Learning

发表时间:NIPS2017 论文链接:https://readpaper.com/pdf-annotate/note?pdfId=4557560538297540609&noteId=2424799047081637376 作者单位:Berkeley AI Research Lab, Work done while at OpenAI Yan Duan†§ , Marcin Andrychow

Introduction to Deep Learning with PyTorch

1、Introduction to PyTorch, a Deep Learning Library 1.1、Importing PyTorch and related packages import torch# supports:## image data with torchvision## audio data with torchaudio## text data with t

《Learning To Count Everything》CVPR2021

摘要 论文提出了一种新的方法来解决视觉计数问题,即在给定类别中仅有少量标注实例的情况下,对任何类别的对象进行计数。将计数问题视为一个少样本回归任务,并提出了一种新颖的方法,该方法通过查询图像和查询图像中的少量示例对象来预测图像中所有感兴趣对象的存在密度图。此外,还提出了一种新颖的适应策略,使网络能够在测试时仅使用新类别中的少量示例对象来适应任何新的视觉类别。为了支持这一任务,作者还引入了一个包含