BioTech - ADMET的性质预测 概述

2024-03-04 20:28

本文主要是介绍BioTech - ADMET的性质预测 概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/136438192

ADMET

ADMET,即 Absorption、Distribution、Metabolism、Excretion、Toxicity,吸收、分布、代谢、排泄、毒性,这些性质对于药物的疗效和安全性有重要的影响。因此,在药物开发的早期阶段,就能依据化合物的 ADMET 性质,对于先导化合物进行有针对性的选取和优化,是非常必要的。然而,实验评估 ADMET 性质是耗时、耗费和有限的,因此,利用机器学习或深度学习等计算方法来预测 ADMET 性质,是一种有效的替代方案。

1. ADMET 预测算法

ADMET 预测算法

目前,有许多基于机器学习或深度学习的 ADMET 性质预测的算法和工具,主要利用了大量的公共数据库中的化合物数据和相关的 ADMET 实验数据,以及一些专业的特征提取方法,来构建不同的预测模型。例如:

  • ADMETboost:基于树的机器学习模型,使用多种特征,包括指纹和描述符,来预测 22 个 ADMET 任务,包括溶解度、血浆蛋白结合、肝脏代谢、肾脏排泄等。该模型在 Therapeutics Data Commons (TDC,治疗数据共享) 的 ADMET 基准数据集上表现优异,对于 22 个任务,该模型在 18 个任务中排名第一,在 21 个任务中排名前三。
  • ADMETlab:在线工具,提供了一系列计算模型,包括溶解度、血浆蛋白结合、肝脏代谢、肾脏排泄等,可以预测药物在人体内的吸收、分布、代谢和排泄过程,并且评估其潜在的毒性和安全性。该工具使用多种机器学习模型,如随机森林、支持向量机和 k-最近邻等,以及一些深度学习模型,如多任务图注意力网络等。该工具可以预测 53 个 ADMET 终点,覆盖了多种 ADMET 相关的性质。
  • SwissADME:免费的在线工具,提供了一系列计算模型,包括溶解度、血浆蛋白结合、肝脏代谢、肾脏排泄和 CYP450 互作等,可以预测药物在人体内的吸收、分布、代谢和排泄过程,并评估其潜在的毒性和安全性。该工具还提供了一些额外的功能,如药物分子库筛选和药物相互作用预测等。
  • XenoSite Web:这是一款非常有用的在线工具,采用多种机器学习算法和特征提取方法,可以帮助药物研究人员更好地了解和预测药物分子在细胞色素 P450 酶(CYP450)中的代谢过程及相应的代谢位点,并生成代谢产物的结构。这对于药物研究和开发来说非常重要,因为 CYP450 酶是药物代谢和毒性的主要通路之一。

尽管基于机器学习或深度学习的 ADMET 性质预测的算法和工具已经取得了很多进展和成果,但是仍然存在一些难点和挑战,例如:

  • 数据的质量和数量:ADMET 性质预测的准确性和可靠性很大程度上依赖于数据的质量和数量。然而,目前,可用的数据往往是不完整、不一致、不可靠或不可获取的,这给数据的收集、整理、标准化和共享带来了困难。因此,需要更多的努力来提高数据的质量和数量,以及建立更好的数据管理和交换平台。
  • 特征的选择和提取:特征是指用于描述和表示化合物的一些属性或参数,如指纹、描述符、拓扑、结构等。特征的选择和提取对于机器学习或深度学习模型的性能和效率有重要的影响。然而,目前,还没有一个统一的标准或方法来确定哪些特征是最适合或最重要的,以及如何从复杂的化合物结构中提取这些特征。因此,需要更多的研究来探索和开发更好的特征选择和提取方法。
  • 模型的构建和评估:模型是指用于预测 ADMET 性质的一些数学或计算的方法或过程,如线性回归、决策树、神经网络等。模型的构建和评估涉及到很多的参数和指标,如训练集、测试集、验证集、交叉验证、超参数、准确率、灵敏度、特异度等。这些参数和指标的选择和调整对于模型的性能和效率有重要的影响。然而,目前还没有一个统一的标准或方法来确定哪些参数和指标是最适合或最优化的,以及如何从多个模型中选择或组合最佳的模型。因此,需要更多的研究来探索和开发更好的模型构建和评估方法。

ADMET 应用场景主要包括:

  • 药物筛选:对于大量的候选化合物进行ADMET性质的评估,从中筛选出符合成药要求的化合物,以进入后续的药效和安全性的验证。
  • 药物设计:对于已知的化合物进行ADMET性质的分析,从中发现影响ADMET性质的结构特征或分子描述符,以指导化合物的结构优化或改造,以提高药物的成药性。
  • 药物代谢:对于药物在体内的代谢过程及相应的代谢产物进行预测和分析,以了解药物的代谢途径、代谢酶、代谢稳定性、代谢活性等,以评估药物的药效和毒性。
  • 药物毒性:通过计算方法或实验方法,对药物在体内的毒性效应进行预测和分析,以了解药物的致癌性、致畸性、致敏性、肝毒性、肾毒性等,以评估药物的安全性和副作用。

2. 药物毒性预测

药物毒性预测
毒性是指化合物对生物体的不良影响,是药物发现过程中的一个重要因素,属于药物的 ADME/T (吸收、分布、代谢、排泄和毒性) 属性之一。药物毒性预测,是指利用计算方法来评估候选药物的潜在毒性,以筛选出安全有效的化合物,降低药物开发的时间和成本。

基于机器学习或深度学习的药物毒性预测是指利用人工智能技术来构建预测模型,从化学结构、基因组数据、高通量筛选数据等各种数据源中提取特征,学习化合物与毒性的关系,预测化合物在不同的毒性终点上的活性或风险。这些方法可以提高预测的准确性和效率,同时也可以减少对动物实验的依赖。

基于机器学习或深度学习的药物毒性预测,也面临着一些难点和挑战,主要包括:

  • 数据的质量和数量。药物毒性预测需要大量的高质量的数据来训练和验证模型,但是,目前可用的数据往往存在不完整、不一致、不平衡、不可比等问题,导致模型的泛化能力和可靠性受到影响。
  • 特征的选择和工程。药物毒性预测需要从复杂的数据中提取有效的特征来表示化合物的结构和性质,但是,目前还没有统一的标准和方法来选择和构造最优的特征,不同的特征可能导致不同的预测结果。
  • 模型的解释性和透明度。药物毒性预测需要模型能够提供可解释的预测结果,以便理解化合物的毒性机制和作用途径,但是,目前的机器学习或深度学习模型往往是黑盒式的,难以揭示预测的内在逻辑和依据。
  • 伦理和监管的问题。药物毒性预测需要模型能够符合伦理和监管的要求,以保证药物的安全性和有效性,但是,目前的机器学习或深度学习模型还没有得到广泛的认可和接受,需要更多的验证和评估。

3. 药物代谢产物预测

药物代谢产物
代谢 Metabolism 是药物在体内受酶系统或者肠道菌丛的作用而发生结构转化的过程,是药物代谢动力学 (ADME) 中的一个重要方面。代谢产物预测是指根据药物分子的结构和性质,预测其可能的代谢途径和代谢产物的结构。这对于评估药物的安全性、有效性和药物相互作用有重要意义。其中,细胞色素 P450 (CYP450) 是一类广泛存在于生物体中的氧化还原酶,参与了大约 75% 的药物代谢反应。因此,预测药物分子的 CYP450 代谢位点和代谢产物是代谢产物预测的核心问题。

基于机器学习或深度学习的代谢产物预测是一种利用计算模型和算法,从大量的实验数据中学习和推断药物代谢规律的方法。近年来,这种方法在代谢产物预测领域取得了一些进展和突破,提高了预测的准确性和效率。

药物代谢产物预测的难点和挑战,包括:

  • 数据的质量和数量:代谢产物预测需要大量的高质量的实验数据来训练和验证计算模型,但是,目前可用的数据集往往规模有限、分布不均、缺乏标准化和注释,导致模型的泛化能力和可靠性受到影响。
  • 模型的复杂性和可解释性:代谢产物预测涉及到多种代谢酶、多种代谢途径、多种代谢产物,以及它们之间的相互作用和影响,这使得模型的构建和优化变得非常复杂和困难。同时,基于机器学习或深度学习的模型往往缺乏可解释性,难以揭示药物代谢的分子机制和生物学意义。
  • 模型的适应性和可扩展性:代谢产物预测需要考虑不同的生物体、不同的组织、不同的环境、不同的药物等多种因素的影响,这要求模型具有良好的适应性和可扩展性,能够适应不同的场景和需求,但是,目前的模型往往只针对特定的条件和数据进行训练和测试,难以泛化到其他情况。

CYP450 是细胞色素 P450 的简称,是含有血红素作为辅因子的单加氧酶,广泛存在于生物体中,参与许多重要的生物合成和代谢过程。CYP450 酶可以催化多种有机底物的氧化反应,例如将氧氛中的一个氧原子插入到底物分子中,而另一个氧原子被还原形成水。CYP450 酶在药物代谢中起着关键作用,影响药物的活性、安全性和药物-药物相互作用。CYP450 酶是一个庞大的酶超家族,有许多不同的同工酶和亚型,根据氨基酸序列和结构特征进行分类和命名。

这篇关于BioTech - ADMET的性质预测 概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/774339

相关文章

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

Java 多线程概述

多线程技术概述   1.线程与进程 进程:内存中运行的应用程序,每个进程都拥有一个独立的内存空间。线程:是进程中的一个执行路径,共享一个内存空间,线程之间可以自由切换、并发执行,一个进程最少有一个线程,线程实际数是在进程基础之上的进一步划分,一个进程启动之后,进程之中的若干执行路径又可以划分成若干个线程 2.线程的调度 分时调度:所有线程轮流使用CPU的使用权,平均分配时间抢占式调度

java集合的概述

集合就是一个容器,我们可以把多个对象放入的容器中。就像水杯(假设容量可以不断扩大)一样,你可以往水杯中不断地添加水,既然是水杯,你就不能往里添加沙子,也就是说集合中添加的对象必须是同一个类型的(引用类型,而不能是基本类型)。 看到集合的介绍会让我们的想起数组,那么集合和数组有什么区别呢? 首先,数组的大小是固定的,而集合理论上大小是不限的。 其次,数组既可以存储基本数据类型的数据,也可以存储

【CSS in Depth 2 精译_023】第四章概述 + 4.1 Flexbox 布局的基本原理

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第一章 层叠、优先级与继承(已完结) 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结 第二章 相对单位(已完结) 2.1 相对单位的威力2.2 em 与 rem2.3 告别像素思维2.4 视口的相对单位2.5 无单位的数值与行高2.6 自定义属性2.7 本章小结 第三章 文档流与盒模型(已

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

Unity Adressables 使用说明(一)概述

使用 Adressables 组织管理 Asset Addressables 包基于 Unity 的 AssetBundles 系统,并提供了一个用户界面来管理您的 AssetBundles。当您使一个资源可寻址(Addressable)时,您可以使用该资源的地址从任何地方加载它。无论资源是在本地应用程序中可用还是存储在远程内容分发网络上,Addressable 系统都会定位并返回该资源。 您

Tensorflow lstm实现的小说撰写预测

最近,在研究深度学习方面的知识,结合Tensorflow,完成了基于lstm的小说预测程序demo。 lstm是改进的RNN,具有长期记忆功能,相对于RNN,增加了多个门来控制输入与输出。原理方面的知识网上很多,在此,我只是将我短暂学习的tensorflow写一个预测小说的demo,如果有错误,还望大家指出。 1、将小说进行分词,去除空格,建立词汇表与id的字典,生成初始输入模型的x与y d

临床基础两手抓!这个12+神经网络模型太贪了,免疫治疗预测、通路重要性、基因重要性、通路交互作用性全部拿下!

生信碱移 IRnet介绍 用于预测病人免疫治疗反应类型的生物过程嵌入神经网络,提供通路、通路交互、基因重要性的多重可解释性评估。 临床实践中常常遇到许多复杂的问题,常见的两种是: 二分类或多分类:预测患者对治疗有无耐受(二分类)、判断患者的疾病分级(多分类); 连续数值的预测:预测癌症病人的风险、预测患者的白细胞数值水平; 尽管传统的机器学习提供了高效的建模预测与初步的特征重