本文主要是介绍2022 nature machine intelligence | GLAM: An adaptive graph learning method for automated molecular i,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
2022 nature machine intelligence | GLAM: An adaptive graph learning method for automated molecular interactions and properties predictions
Paper:https://www.researchsquare.com/article/rs-1172418/latest.pdf
Code: https://github.com/yvquanli/GLAM
提高药物发现效率是药物发现的核心和长期挑战。为此,已经开发了许多图学习方法来快速、低成本地搜索潜在的候选药物。事实上,在有限数量的数据集上追求高预测性能已经使它们结晶化,使它们在重新利用药物发现产生的新数据方面失去了优势。在这里,我们提出了一种灵活的方法,可以适应任何数据集并做出准确的预测。所提出的方法采用自适应管道从数据集中学习并输出预测器。在没有任何人工干预的情况下,该方法在所有测试数据集上实现了比基于手工设计的神经架构和其他固定项目的传统方法更好的预测性能。此外,我们发现所提出的方法比传统方法更稳健,并且可以提供有意义的可解释性。鉴于上述情况,所提出的方法可以作为一种可靠的方法来预测具有高适应性、性能、鲁棒性和可解释性的分子相互作用和性质。
最近,已经报道了一些解决架构和超参固化问题的工作。MolMapNet引入了一种开箱即用的深度学习方法,该方法基于广泛学习基于知识的表示,无需人工干预即可在更多数据集上实现可靠的预测性能。最近的一项工作还介绍了一种基于神经架构搜索的方法,可以自动为任何分子特性预测数据集设计神经架构。
在这项研究中,兰州大学和腾讯量子实验室的研究人员,提出了「基于图学习的自适应机器」(GLAM),这是一种灵活的方法,可以适应任何数据集并在无需人工干预的情况下做出准确的预测。
他们在广泛的数据集上将新方法与之前报道的方法在预测性能方面进行了比较。结果表明,该团队的方法可以很好地适应所有测试数据集,并且比其他报告的方法获得更好的预测性能。他们还研究了该方法的稳健性和可解释性,发现它比其他测试方法更稳健,并且可以提供有意义的可解释性,使其成为更可靠的方法。
方法
该团队的方法利用自动化流程从数据集中学习并构建预测器,如下图所示。以前的图学习方法严重依赖人类专家来设计架构、设置模型超参数、选择优化器和选择损失函数。该团队创新性地将这四项结合起来,构建了一个配置空间。从这个配置空间开始,GLAM 执行一系列步骤来构建集成预测器。
GLAM 和传统方法的对比
研究人员设计了两种通用架构,一种用于分子相互作用,另一种用于分子属性。通用架构中的每个模块都有自己的设计空间。
该架构在执行药物-靶标相互作用任务时将分子图和蛋白质图作为输入,在执行药物-药物相互作用任务时将两个分子图作为输入,在执行分子属性预测任务时将单个分子图作为输入。
数据集
GLAM 旨在适应任何给定的数据集以获得高预测性能。为了研究该方法的适应性和性能,研究人员将其在 14 个数据集上的性能,与一系列具有代表性的传统方法进行了比较。测试数据集的类型包括药物-蛋白质相互作用、药物-药物相互作用、物理化学性质、生物活性、药代动力学和毒性。
对分子结构扰动的高鲁棒性
下一个要考虑的问题是鲁棒性,这是衡量一个机器学习方法的另一个重要指标。研究人员假设当应用对分子属性几乎没有影响的结构的小扰动时,鲁棒的预测器不应大幅改变其输出。自然扰动总是会影响机器学习方法,并可能导致错误的结果,并在某些安全敏感领域(例如医疗保健)中产生严重后果。诚然,图学习方法的鲁棒性性也是一个重要问题。
案例
为了更好地理解 GLAM 生成的预测器,研究人员调查了它的决策过程,并解释了它学习知识的情况。过去,大多数机器学习模型都被视为黑匣子。以前的研究往往采用了注意力机制来帮助解释模型。
这篇关于2022 nature machine intelligence | GLAM: An adaptive graph learning method for automated molecular i的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!