最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构

本文主要是介绍最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

“AI for Science”作为科研范式的重大改变,给生命科学机理探索和药物研发带来变革性的洞见和视角的同时,也带来更丰富的研究工具和研究方法。以计算生物、计算机辅助药物设计(CADD)、AI药物发现(AIDD)为代表的计算驱动手段相继在生物机理的探索、靶标发现和精准医疗、药物发现与设计等领域取得了显著的进步。AI4S与生物计算分论坛,聚焦探索AI与生命科学、药物研发的深度融合,报告嘉宾在蛋白质从头设计、CADD与AIDD中结构数据的有效利用、蛋白复合物结构预测模型的完全开源、AI赋能医药研发、新药设计的挑战与机遇等AI for Life Science前沿领域进行了分享。AI4S与生物计算分论坛,进一步加快AI4S在生命科学的扩散,加深生命科学领域的科学家、工程师对AI4S的理解和认知,催化AI4S与生命科学、生物计算的迅速融合。

蛋白质结构解析的传统方法与研究进展,以及新兴的互联网技术与计算机算法为蛋白质科学研究领域带来的影响与对未来展望。诸如此类的的基础研究对农业的发展是必不可少的,除此之外,通过多种生物信息学工具预测蛋白质之间的的相互作用,不仅可以为接下来作物抗病育种的研究带来理论支撑,也在一定程度上反应传统农业研究与互联网时代农业研究在各个分面的差别

一、科研背景

CADD计算机辅助药物设计

依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,CADD的应用,包括基于结构的药物设计(SBDD)、基于配体的药物设计(LBDD)、高通量虚拟筛选(HTVS)等技术,突破了传统的先导物发现模式,极大地促进了先导化合物发现和优化。特别是在食品、生物、化学、医药、植物、疾病方面应用广泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。CADD的应用可以加快靶点发现的速度,提高靶点发现的准确度,从而推进新药研

AIDD人工智能药物发现与设计

是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。随着医药大数据的积累和人工智能技术的发展,运用AI技术并结合大数据的精准药物设计也不断推动着创新药物的发展。在新型冠状病毒的治疗方案中,通过一系列计算机辅助药物生物计算的方法发现一大类药物分子可以有效阻止新冠病毒的侵染,为治疗新冠提供了新思路。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒

蛋白质晶体结构解析

近年来结构生物学发展迅速并和其他学科相互渗透交叉,特别是受到结构基因组学等热点学科的极大带动。作为结构生物学的基本手段和技术,蛋白质晶体学从解析简单的蛋白质三维结构延伸到解决各类生物大分子及复合物结构,并更加注重研究结构与功能之间的相互关系,派生出诸如基于结构的药物设计等应用性很强的分支。生物技术及计算机技术的飞速发展,尤其是高通量技术在生物学领域的应用,为蛋白质晶体学带来了全新的概念和更加广阔的前景

二、学习目标

CADD计算机辅助药物设计:能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟

AIDD人工智能药物发现与设计:了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力。

蛋白质晶体结构解析:了解蛋白质晶体结构解析的原理、方法与技术,学习分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构。很轻松地解析出蛋白晶体结构,并进行晶体结构的精修

四、内容

一、CADD计算机辅助药物设计

第一天上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1 优势及主要功能介绍

3.2 界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白

-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点

PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1 金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

α-糖苷转移酶和多糖分子对接为例

5.核酸-小分子对接

5.1核酸-小分子的应用现状

5.2相关的程序介绍

5.3核酸-小分子的结合种类

5.4核酸-小分子对接

5.5相关结果的分析

以人端粒

g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶

2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白

(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3 体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1 高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

下方为部分案例图:

二、AIDD人工智能药物发现与设计

(第一天)

人工智能与药物发现

用工具的介绍与安装

从CADD到AIDD的介绍

1.计算机辅助药物设计(CADD)简介

1.2.分子对接与分子动力学背景介绍

1.3.人工智能药物发现(AIDD)简介

2.机器学习与深度学习在药物发现中的背景介绍

2.1药物发现与设计

2.2基于结构的药物发现与设计

2.3基于配体的药物发现与设计

3.1Anaconda3/Pycharm安装

3.2python 编程基础

3.3Pandas基础

3.4NumPy基础

3.5RDKit基础

3.6Pytorch基础

3.7Tensorflow基础

3.8DeepChem基础

(第二天)

机器学习与药物发现(分类任务)

1.分类模型的构建与应用

1.1逻辑回归算法原理

1.2朴素贝叶斯算法原理

1.3k最近邻算法原理

1.4支持向量机算法原理

1.5随机森林算法原理

1.6梯度提升算法原理

1.7多层感知机算法原理

1.8特征工程

1.9缺失值填补

2.特征归一化

2.1变量筛选

2.2模型评估方法

2.3交叉验证

2.4外部验证

3.分类模型的常用评价指标

3.1混淆矩阵

3.2准确率

3.3敏感性

3.4特异性

3.5模型选择

3.6格点搜索超参数调优

3.7k折交叉验证

分类模型的实例讲解与练习,以给定数据集为例,讲解基于以上机器学习算法的生物活性或ADMET性质预测模型。引导学员构建自己的数据模型,并用于小分子化合物的活性或ADMET性质预测。

(第三天)

机器学习与药物发现(回归任务)

1.随机森林回归

2.支持向量机回归

3.XGboost回归

4.多层感知机回归

5.神经网络回归

6.回归模型的常用评价指标

6.1MSE

6.2RMSE

6.3MAE

6.4R2

QSAR/3D-QSAR模型

以给定数据集为例,讲解基于上述几种机器学习算法构建生物活性如pIC50或ADMET性质预测模型。

(第四天)

深度学习与药物发现

1.深度学习的发展历程与在药物开发中的应用

1.1多层感知机/人工神经网络

1.2基于梯度的学习

1.3反向传播算法

1.4随机梯度下降

1.5卷积神经网络介绍

1.6图神经网络介绍

基于PyTorch的多层感知机算法的实例讲解与练习

以给定数据集为例,讲解基于多层感知机的化合物性质预测模型。

以给定数据集为例,讲解基于卷积神经网络的化合物图像预测分类模型。

以给定数据集为例,讲解基于图神经网络对化合物的毒性分类预测模型。

(第五天)

分子生成模型

1.生成式对抗网络(GANs)的基本原理

1.2生成器

1.3判别器

1.4循环神经网络(RNN)

1.5长短期记忆网络(LSTM)

2.基于上下文的循环神经网络序列建模

3.基于字符串的小分子化合物生成模型

4.基于图数据的小分子化合物生成模型

实例讲解与练习,以给定数据集为例,构建分子生成模型。

三、蛋白质晶体结构解析

第一天

蛋白质结晶前准备

1. 目的蛋白质信息检索(包括实操演示)

1.1 不同种属的蛋白

1.2 蛋白质一级结构的调查

1.3 蛋白质三级结构的预测

1.4 蛋白质理化特性的预测

1.5 蛋白质的配体和共价修饰

2. 分子克隆技术

2.1 目的基因的获取(包括实操演示)

2.2 目的基因的引物设计(包括实操演示)

2.3 传统克隆技术(涉及学习SnapGene软件,包括实操演示)

2.4 无缝克隆技术(涉及学习SnapGene软件,包括实操演示)

以某一基因进行操作演示

3. 利用大肠杆菌表达目的蛋白

3.1 目的蛋白的小量鉴定表达

3.2 目的蛋白的大量表达

3.3 收菌和裂解菌体

3.4 裂解液的离心

3.5 目的蛋白的浓缩

3.6 目的蛋白浓度的测定

4. 真核表达系统

第二天

蛋白质结晶技术

1. 蛋白晶体结构的特征

1.1 蛋白晶体的空间格子、晶胞和晶面指标

1.2 蛋白晶体的对称性、点群、晶系和空间群

2. 蛋白质晶体生长的理论知识(详细讲解温度、pH值、离子强度、有机溶剂、沉淀剂,等等,对蛋白晶体生长的影响;影响蛋白质晶型的因素)

3. 蛋白质晶体生长条件的初筛(详细讲解晶体初筛的注意事项)

4. 蛋白质晶体生长条件的优化 (详细讲解晶体优化的方法,包括改变pH值、沉淀剂,等因素)

5. 晶种法优化蛋白质晶体生长条件

6. 蛋白晶体的挑选和防冻液的配制

第三天

蛋白晶体衍射数据收集

1. X射线衍射

1.1. X射线衍射原理

1.2. X射线衍射的电子密度

1.3. 晶体结构解析的相角问题

2. 上海光源线站BL18U1、BL19U1和BL02U1收集数据的方法 (重点详细讲解,可能需要更长的时间)

3. 蛋白晶体结构解析软件的安装(包括Ubuntu系统、Phenix软件、CCP4软件、PyMoL软件、XDS软件和Adxv软件)

第四天

蛋白晶体结构解析

1.晶体结构的解析

1.1. 晶体结构解析流程

1.2. Index、Intergrate和Scale

1.3. 分子置换技术(包括实操演示)

1.4. 蛋白晶体结构的重建(包括实操演示)

1.5. 蛋白晶体结构的优化(包括实操演示)

2. 晶体结构的精修(涉及COOT软件、Phenix软件和CCP4软件,包括实操演示)

3. 晶体结构质量的评价指标(详细讲解各个评价指标)

4. 蛋白质结构中加入小分子配体

5. 在结构解析过程中,如何利用软件提高分辨率(重点讲解,需要较长的时间)

第五天

蛋白晶体结构的提交及展示

1. 从晶体生长到解析,详细剖析提高分辨率的方法(包括示例演示)

2. 蛋白晶体结构数据提交到PDB(包括实操演示)

3. 蛋白晶体结构的展示(包括实操演示)

六、时间

CADD计算机辅助药物设计

2023.7.29 -----2023.7.30 全天(上午09.00-11.30 下午13.30-17.00)

2023.8.1-----2023.8.4晚上(晚上19.00-22.00)

2023.8.5-----2023.8.6全天(上午09.00-11.30 下午13.30-17.00)

2023.8.8-----2023.8.9晚上(晚上19.00-22.00)

AIDD人工智能药物发现与设计

2023.8.5 -----2023.8.6 全天(上午09.00-11.30 下午13.30-17.00)

2023.8.8-----2023.8.9晚上(晚上19.00-22.00)

2023.8.12-----2023.8.13全天(上午09.00-11.30 下午13.30-17.00)

蛋白质晶体结构解析

2023.08.01----2023.08.04晚上(晚上19.00-22.00)

2023.08.05 -----2023.08.06 全天(上午09.00-11.30 下午13.30-17.00)

2023.08.08-----2023.08.09晚上(晚上19.00-22.00)

实操及科研问题

往期参会单位

有来自四川大学、中科院大学、上海交通大学、中国人民解放军海军军医大学、江南大学、中国农业大学、南昌大学、合肥工业大学、天津科技大学、华中农业大学、山东理工大学、北京工商大学、江苏大学、江南大学、大连工业大学、华南理工大学成都中医药大学、北京大学、浙江大学、中南大学、复旦大学、东北大学、国防科技大学、江苏海洋大学、华中科技大学、湖北大学、中国医学科学院、中南大学湘雅医院、中国药科大学、协和药物研究所、中国农业科学院基因组研究所、广州中医药大学、上海中医药大学、上海理工大学、北京中医药大学、武汉大学、香港大学、沈阳药科大学、山东中医药大学、宁波大学、山东大学、甘肃中医药大学、医学院附属仁济医院、中国医学科学院药物研究所、杭州医学院、广州医科大学附属肿瘤医院、中山大学孙逸仙纪念医院、江苏省中医院、中国中医科学院广安门医院、中山大学附属第五医院、中山大学中山眼科中心、汕头大学、扬州大学、天津科技大学、东南大学、上海应用技术大学、中国农业科学院深圳农业基因组研究所 、绍兴文理学院、乔治梅森大学、南京小飞象生物科技有限公司、加州大学、广东省科学院微生物研究所(广东省微生物分析检测中心)、山东绿叶制药有限公司、北京泰德制药股份有限公司、深圳龙昌新药研发有限公司、Osaka University、上海美迪西、防化研究院、国防科技创新研究院、北京安必奇生物科技有限公司、国家纳米科学中心、军事科学院防化研究院、南方科技大学、中国科学院化学研究所、中国农业科学院茶叶研究所、四川国康药业有限公司、南通药明康德医药科技有限公司、南京沛微生物科技有限公司、北京科诺信诚科技有限公司、天士力生物医药股份有限公司、泽达易盛(天津)科技股份有限公司、沈阳市青囊医疗科技有限责任公司、青岛科博源生物技术有限公司、中科聚研(吉林)干细胞科技有限公司、广州同隽医药科技有限公司、北京斯利安药业有限公司、上海韵和生物医药有限公司、北京英飞智药科技有限公司、上海森辉医药有限公司、上海倍勘生物技术有限公司、浙江海正股份有限公司等公司的四百余名工程师老师学生参会,还有许多因为时间冲突没法参加。这次,我们诚挚邀请您来参加!

这篇关于最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287984

相关文章

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

Golang使用etcd构建分布式锁的示例分享

《Golang使用etcd构建分布式锁的示例分享》在本教程中,我们将学习如何使用Go和etcd构建分布式锁系统,分布式锁系统对于管理对分布式系统中共享资源的并发访问至关重要,它有助于维护一致性,防止竞... 目录引言环境准备新建Go项目实现加锁和解锁功能测试分布式锁重构实现失败重试总结引言我们将使用Go作

在C#中合并和解析相对路径方式

《在C#中合并和解析相对路径方式》Path类提供了几个用于操作文件路径的静态方法,其中包括Combine方法和GetFullPath方法,Combine方法将两个路径合并在一起,但不会解析包含相对元素... 目录C#合并和解析相对路径System.IO.Path类幸运的是总结C#合并和解析相对路径对于 C

Ubuntu 怎么启用 Universe 和 Multiverse 软件源?

《Ubuntu怎么启用Universe和Multiverse软件源?》在Ubuntu中,软件源是用于获取和安装软件的服务器,通过设置和管理软件源,您可以确保系统能够从可靠的来源获取最新的软件... Ubuntu 是一款广受认可且声誉良好的开源操作系统,允许用户通过其庞大的软件包来定制和增强计算体验。这些软件

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

Java解析JSON的六种方案

《Java解析JSON的六种方案》这篇文章介绍了6种JSON解析方案,包括Jackson、Gson、FastJSON、JsonPath、、手动解析,分别阐述了它们的功能特点、代码示例、高级功能、优缺点... 目录前言1. 使用 Jackson:业界标配功能特点代码示例高级功能优缺点2. 使用 Gson:轻量

Java如何接收并解析HL7协议数据

《Java如何接收并解析HL7协议数据》文章主要介绍了HL7协议及其在医疗行业中的应用,详细描述了如何配置环境、接收和解析数据,以及与前端进行交互的实现方法,文章还分享了使用7Edit工具进行调试的经... 目录一、前言二、正文1、环境配置2、数据接收:HL7Monitor3、数据解析:HL7Busines

python解析HTML并提取span标签中的文本

《python解析HTML并提取span标签中的文本》在网页开发和数据抓取过程中,我们经常需要从HTML页面中提取信息,尤其是span元素中的文本,span标签是一个行内元素,通常用于包装一小段文本或... 目录一、安装相关依赖二、html 页面结构三、使用 BeautifulSoup javascript

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行