Multi-Objective Molecule Generation using Interpretable Substructures

本文主要是介绍Multi-Objective Molecule Generation using Interpretable Substructures,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2021/7/22

摘要:药物设计问题旨在发现满足目标化学性质要求的新分子结构,当面对多性质优化问题时这项工作便变得极其困难。本文提出了一种解决这种复杂性的方法,通过一个子结构语料库来组成分子,称之为分子基本准则,这些子结构是从分子中确定的可能对某个属性有贡献的子结构,这样的方法属于“基于分子碎片”的设计方法。
实现自动生成分子的模型包括两个步骤:

  • 在性质预测模型的帮助下提取出用于构建分子的分子碎片,这一步看作一个离散优化问题,采用蒙特卡洛树搜索方法来求解;
  • 组装出目标分子。使用强化学习对混合模型进行微调,以确保生成的分子保留所有目标属性。
    与其他方法相比,生成模型不是从零开始构建分子,而是从已经涉及到特定属性的自动提取的基本原理中的碎片组装分子。
    P ( G ) = ∑ S P ( G ∣ S ) P ( S ) P(\mathcal{G})=\sum_{\mathcal{S}} P(\mathcal{G} \mid \mathcal{S}) P(\mathcal{S}) P(G)=SP(GS)P(S)

问题构成
Find(寻求一个分子): G = ( V , E ) \mathcal{G}=(\mathcal{V},\mathcal{E}) G=(V,E)
subject to(性质约束): r i ( G ) ≥ δ i ; i = 1 , ⋯ , M r_{i}(\mathcal{G}) \geq \delta_{i} ; \quad i=1, \cdots, M ri(G)δi;i=1,,M
r i ( G ) r_{i}(\mathcal{G}) ri(G)为性质预测模型的输出结果,如随机森林等,每个 i i i为一个目标性质。

其中rationale碎片 S \mathcal{S} S 来自于语料库 V S [ M ] V_{\mathcal{S}}^{[M]} VS[M],然后生成分子 G \mathcal{G} G

生成模型为:
P ( G ) = ∑ S P ( G ∣ S ) P ( S ) P(\mathcal{G})=\sum_{\mathcal{S}} P(\mathcal{G} \mid \mathcal{S}) P(\mathcal{S}) P(G)=SP(GS)P(S)

在这里插入图片描述

  • Rationale Extraction 提取得到 V S [ M ] V_{\mathcal{S}}^{[M]} VS[M]

  • Graph Completion P ( G ∣ S ) P(\mathcal{G} \mid \mathcal{S}) P(GS)

  • Rationale Distribution P ( S ) P(\mathcal{S}) P(S)
    P(S)的分布是根据 P ( G ∣ S ) P(\mathcal{G} \mid \mathcal{S}) P(GS)生成的完整分子 G \mathcal{G} G的性质得到的。

为了满足化学合理性,这种基于碎片的生成方法都是先生成一个子结构的库,从库中提取碎片来组合生成新的分子。

本文中碎片生成的过程中,考虑了多个目标性质的约束,对于多目标约束的处理方法是先分解成单目标问题,再组合搜索得到多目标碎片解,相比之前看过的单纯通过概率来使用蒙特卡洛树搜索建立的语料库,到底孰优孰劣?初步理解是,单纯通过概率的可能会导致生成的分子结构还是很普通,而且可能生成很多的与目标性质没什么关系的分子结构,容易陷入局部最优;与目标性质相关联之后会不会又导致搜索空间不那么大,但是其实在生成碎片结构的过程就已经相当于一个筛选过程了,搜索的空间已经与目标性质高度相关,这样子搜索的效率会更高。

VAE的东西还是不是很懂,赶紧补一补。另外,蒙特卡洛搜索的依据我觉得有点像是贪心法,我敲我怎么一直对这个算法朦朦胧胧的,都得赶紧补啊shit!

这篇关于Multi-Objective Molecule Generation using Interpretable Substructures的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/602883

相关文章

2014 Multi-University Training Contest 8小记

1002 计算几何 最大的速度才可能拥有无限的面积。 最大的速度的点 求凸包, 凸包上的点( 注意不是端点 ) 才拥有无限的面积 注意 :  凸包上如果有重点则不满足。 另外最大的速度为0也不行的。 int cmp(double x){if(fabs(x) < 1e-8) return 0 ;if(x > 0) return 1 ;return -1 ;}struct poin

2014 Multi-University Training Contest 7小记

1003   数学 , 先暴力再解方程。 在b进制下是个2 , 3 位数的 大概是10000进制以上 。这部分解方程 2-10000 直接暴力 typedef long long LL ;LL n ;int ok(int b){LL m = n ;int c ;while(m){c = m % b ;if(c == 3 || c == 4 || c == 5 ||

2014 Multi-University Training Contest 6小记

1003  贪心 对于111...10....000 这样的序列,  a 为1的个数,b为0的个数,易得当 x= a / (a + b) 时 f最小。 讲串分成若干段  1..10..0   ,  1..10..0 ,  要满足x非递减 。  对于 xi > xi+1  这样的合并 即可。 const int maxn = 100008 ;struct Node{int

LLVM入门2:如何基于自己的代码生成IR-LLVM IR code generation实例介绍

概述 本节将通过一个简单的例子来介绍如何生成llvm IR,以Kaleidoscope IR中的例子为例,我们基于LLVM接口构建一个简单的编译器,实现简单的语句解析并转化为LLVM IR,生成对应的LLVM IR部分,代码如下,文件名为toy.cpp,先给出代码,后面会详细介绍每一步分代码: #include "llvm/ADT/APFloat.h"#include "llvm/ADT/S

Python安装llama库出错“metadata-generation-failed”

Python安装llama库出错“metadata-generation-failed” 1. 安装llama库时出错2. 定位问题1. 去官网下载llama包 2.修改配置文件2.1 解压文件2.2 修改配置文件 3. 本地安装文件 1. 安装llama库时出错 2. 定位问题 根据查到的资料,发现时llama包中的execfile函数已经被下线了,需要我们手动修改代码后

【硬刚ES】ES基础(二十一) 单字符串多字段查询:Multi Match

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的ES部分补充。

Show,Attend and Tell: Neural Image Caption Generation with Visual Attention

简单的翻译阅读了一下 Abstract 受机器翻译和对象检测领域最新工作的启发,我们引入了一种基于注意力的模型,该模型可以自动学习描述图像的内容。我们描述了如何使用标准的反向传播技术,以确定性的方式训练模型,并通过最大化变分下界随机地训练模型。我们还通过可视化展示了模型如何能够自动学习将注视固定在显着对象上,同时在输出序列中生成相应的单词。我们通过三个基准数据集(Flickr9k,Flickr

2015 Multi-University Training Contest 5 1009 MZL#39;s Border

MZL's Border  Problem's Link:  http://acm.hdu.edu.cn/showproblem.php?pid=5351   Mean:  给出一个类似斐波那契数列的字符串序列,要你求给出的f[n]字符串中截取前m位的字符串s中s[1...i] = s[s.size()-i+1....s.size()]的最大长度。 analyse:   过计算

Segmentation简记-Multi-stream CNN based Video Semantic Segmentation for Automated Driving

创新点 1.RFCN & MSFCN 总结 网络结构如图所示。输入视频得到图像分割结果。 简单粗暴

Core Text Objective-C Wrapper

Core Text Objective-C Wrapper https://github.com/akosma/CoreTextWrapper Introduction(介绍) One of the most promising and mysterious new frameworks introduced in iOS 3.2 is Core Text. Apple define