Pocket2Mol + Generation of Atom Positions生成原子位置的方法有什么?联合概率是什么?

本文主要是介绍Pocket2Mol + Generation of Atom Positions生成原子位置的方法有什么?联合概率是什么?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

联合概率:

联合概率是统计学中的一个概念,用于描述两个或多个随机事件同时发生的概率。当我们谈论多个变量的联合概率时,我们是在探讨这些变量同时取特定值的概率。

让我们简化一下概念:

  • 假设你有一个骰子(六面),另有一个硬币。骰子掷出特定数字的概率是独立的概率,硬币正面朝上的概率也是独立的概率。如果你同时掷骰子和硬币,骰子显示3且硬币正面朝上同时发生的概率(比如说1/6乘以1/2)就是一个联合概率的例子。

The prediction of the atom positions is the key issue in the auto-regressive 3D molecular generation. A common strategy is to predict the distributions of distances between the new atoms and all previous atoms (Gebauer et al., 2018, 2019) and sample from the joint distributions. However, the long range distances are hard to predict, which introduces additional errors in the atom generation. Another strategy is to build a local spherical coordinate systems and predict the positions in the local space (Simm et al., 2020), but the transformation between Euclidean space and spherical space is inefficient and not straightforward.

【ICML 2022】Pocket2Mol + Efficient Molecular Sampling Based on 3D Protein Pockets

方法一:预测新的原子与以往原子的分布距离,然后从联合概率中采样

A common strategy is to predict the distributions of distances between the new atoms and all previous atoms and sample from the joint distributions. 然而,长距离很难预测,这在原子生成中引入了额外的误差。

Gebauer, N. W., Gastegger, M., and Sch¨utt, K. T. Generating equilibrium molecules with deep neural networks. arXiv preprint arXiv:1810.11347, 2018. 
Gebauer, N. W., Gastegger, M., and Sch¨utt, K. T. Symmetry adapted generation of 3d point sets for the targeted discovery of molecules. arXiv preprint arXiv:1906.00957, 2019.

方法二:建立局部球面坐标系

Another strategy is to build a local spherical coordinate systems(建立局部球面坐标系) and predict the positions in the local space (Simm et al., 2020), 但欧几里得空间和球面空间之间的转换效率低下且不直接。

这种方法指的是在自回归3D分子生成中建立局部球坐标系,并在该局部空间内预测新原子的位置。具体来说,它涉及以下几个步骤:

  1. 建立局部球坐标系:对于每个新原子,首先选择一个已存在的原子作为参考点,然后以这个参考点为中心建立一个局部球坐标系。这个局部球坐标系以参考点为原点,球面上的点表示可能的新原子位置。

  2. 预测位置:在建立好的局部球坐标系中,模型预测新原子相对于参考点的球坐标,例如极径、极角和方位角。这些球坐标可以直接转换成笛卡尔坐标,从而确定新原子在三维空间中的位置。

  3. 逐步生成:这个过程是自回归的,每次添加一个新原子,就会重复上述步骤来确定新原子的位置。通常情况下,选择的参考点是已经生成的分子中的一个原子,而不是固定的参考点。

这种方法相对于预测新原子与所有已存在原子之间的距离分布,更加直接地在局部空间内进行位置预测。它的优势在于避免了全局距离分布预测的复杂性和不确定性,同时更加高效,因为它直接将问题转化为局部坐标系内的位置预测。然而,这种方法的挑战在于局部球坐标系与笛卡尔坐标系之间的转换可能并不简单,并且可能会引入一些额外的误差

Simm, G. N., Pinsler, R., Cs´anyi, G., and Hern´andez-Lobato, J. M. Symmetry-aware actor-critic for 3d molecular design. arXiv preprint arXiv:2011.12747, 2020.

这篇关于Pocket2Mol + Generation of Atom Positions生成原子位置的方法有什么?联合概率是什么?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/687461

相关文章

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验