本文主要是介绍最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
“AI for Science”作为科研范式的重大改变,给生命科学机理探索和药物研发带来变革性的洞见和视角的同时,也带来更丰富的研究工具和研究方法。以计算生物、计算机辅助药物设计(CADD)、AI药物发现(AIDD)为代表的计算驱动手段相继在生物机理的探索、靶标发现和精准医疗、药物发现与设计等领域取得了显著的进步。AI4S与生物计算分论坛,聚焦探索AI与生命科学、药物研发的深度融合,报告嘉宾在蛋白质从头设计、CADD与AIDD中结构数据的有效利用、蛋白复合物结构预测模型的完全开源、AI赋能医药研发、新药设计的挑战与机遇等AI for Life Science前沿领域进行了分享。AI4S与生物计算分论坛,进一步加快AI4S在生命科学的扩散,加深生命科学领域的科学家、工程师对AI4S的理解和认知,催化AI4S与生命科学、生物计算的迅速融合。
蛋白质结构解析的传统方法与研究进展,以及新兴的互联网技术与计算机算法为蛋白质科学研究领域带来的影响与对未来展望。诸如此类的的基础研究对农业的发展是必不可少的,除此之外,通过多种生物信息学工具预测蛋白质之间的的相互作用,不仅可以为接下来作物抗病育种的研究带来理论支撑,也在一定程度上反应传统农业研究与互联网时代农业研究在各个分面的差别
一、科研背景
CADD计算机辅助药物设计
依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,CADD的应用,包括基于结构的药物设计(SBDD)、基于配体的药物设计(LBDD)、高通量虚拟筛选(HTVS)等技术,突破了传统的先导物发现模式,极大地促进了先导化合物发现和优化。特别是在食品、生物、化学、医药、植物、疾病方面应用广泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。CADD的应用可以加快靶点发现的速度,提高靶点发现的准确度,从而推进新药研
AIDD人工智能药物发现与设计
是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。随着医药大数据的积累和人工智能技术的发展,运用AI技术并结合大数据的精准药物设计也不断推动着创新药物的发展。在新型冠状病毒的治疗方案中,通过一系列计算机辅助药物生物计算的方法发现一大类药物分子可以有效阻止新冠病毒的侵染,为治疗新冠提供了新思路。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒
蛋白质晶体结构解析
近年来结构生物学发展迅速并和其他学科相互渗透交叉,特别是受到结构基因组学等热点学科的极大带动。作为结构生物学的基本手段和技术,蛋白质晶体学从解析简单的蛋白质三维结构延伸到解决各类生物大分子及复合物结构,并更加注重研究结构与功能之间的相互关系,派生出诸如基于结构的药物设计等应用性很强的分支。生物技术及计算机技术的飞速发展,尤其是高通量技术在生物学领域的应用,为蛋白质晶体学带来了全新的概念和更加广阔的前景
二、学习目标
CADD计算机辅助药物设计:能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟
AIDD人工智能药物发现与设计:了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力。
蛋白质晶体结构解析:了解蛋白质晶体结构解析的原理、方法与技术,学习分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构。很轻松地解析出蛋白晶体结构,并进行晶体结构的精修
四、内容
一、CADD计算机辅助药物设计
第一天上午
背景与理论知识以及工具准备
1.PDB数据库的介绍和使用
1.1数据库简介
1.2靶点蛋白的结构查询与选取
1.3靶点蛋白的结构序列下载
1.4靶点蛋白的下载与预处理
1.5批量下载蛋白晶体结构
2.Pymol的介绍与使用
2.1软件基本操作及基本知识介绍
2.2蛋白质-配体相互作用图解
2.3蛋白-配体小分子表面图、静电势表示
2.4蛋白-配体结构叠加与比对
2.5绘制相互作用力
3.notepad的介绍和使用
3.1 优势及主要功能介绍
3.2 界面和基本操作介绍
3.3插件安装使用
下午
一般的蛋白
-配体分子对接讲解
1.对接的相关理论介绍
1.1分子对接的概念及基本原理
1.2分子对接的基本方法
1.3分子对接的常用软件
1.4分子对接的一般流程
2.常规的蛋白-配体对接
2.1收集受体与配体分子
2.2复合体预构象的处理
2.3准备受体、配体分子
2.4蛋白-配体对接
2.5对接结果的分析
以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例
第二天
虚拟筛选
1.小分子数据库的介绍与下载
2.相关程序的介绍
2.1 openbabel的介绍和使用
2.2 chemdraw的介绍与使用
3.虚拟筛选的前处理
4.虚拟筛选的流程及实战演示
案例:筛选新冠病毒主蛋白酶抑制剂
5.结果分析与作图
6.药物ADME预测
6.1ADME概念介绍
6.2预测相关网站及软件介绍
6.3预测结果的分析
第三天
拓展对接的使用方法
1.蛋白-蛋白对接
1.1蛋白-蛋白对接的应用场景
1.2相关程序的介绍
1.3目标蛋白的收集以及预处理
1.4使用算例进行运算
1.5关键残基的预设
1.6结果的获取与文件类型
1.7结果的分析
以目前火热的靶点
PD-1/PD-L1等为例。
2.涉及金属酶蛋白的对接
2.1 金属酶蛋白-配体的背景介绍
2.2蛋白与配体分子的收集与预处理
2.3金属离子的处理
2.4金属辅酶蛋白-配体的对接
2.5结果分析
以人类法尼基转移酶及其抑制剂为例
3.蛋白-多糖分子对接
4.1蛋白-多糖相互作用
4.2对接处理的要点
4.3蛋白-多糖分子对接的流程
4.4蛋白-多糖分子对接
4.5相关结果分析
以
α-糖苷转移酶和多糖分子对接为例
5.核酸-小分子对接
5.1核酸-小分子的应用现状
5.2相关的程序介绍
5.3核酸-小分子的结合种类
5.4核酸-小分子对接
5.5相关结果的分析
以人端粒
g -四链和配体分子对接为例。
操作流程介绍及实战演示
第四天
拓展对接的使用方法
1.柔性对接
1.1柔性对接的使用场景介绍
1.2柔性对接的优势
1.3蛋白-配体的柔性对接
重点:柔性残基的设置方法
1.4相关结果的分析
以周期蛋白依赖性激酶
2(CDK2)与配体1CK为例
2.共价对接
2.1两种共价对接方法的介绍
2.1.1柔性侧链法
2.1.2两点吸引子法
2.2蛋白和配体的收集以及预处理
2.3共价药物分子与靶蛋白的共价对接
2.4结果的对比
以目前火热的新冠共价药物为例。
3.蛋白-水合对接
3.1水合作用在蛋白-配体相互作用中的意义及方法介绍
3.2蛋白和配体的收集以及预处理
3.3对接相关参数的准备
重点:水分子的加入和处理
3.4蛋白-水分子-配体对接
3.5结果分析
以乙酰胆碱结合蛋白
(AChBP)与尼古丁复合物为例
第五天
分子动力学模拟(linux与gromacs使用安装)
1. linux系统的介绍和简单使用
1.1 linux常用命令行
1.2 linux上的常用程序安装
1.3 体验:如何在linux上进行虚拟筛选
2.分子动力学的理论介绍
2.1分子动力学模拟的原理
2.2分子动力学模拟的方法及相关程序
2.3相关力场的介绍
3.gromacs使用及介绍
重点:主要命令及参数的介绍
4.origin介绍及使用
第六天
溶剂化分子动力学模拟的执行
1.一般的溶剂化蛋白的处理流程
2.蛋白晶体的准备
3.结构的能量最小化
4.对体系的预平衡
5.无限制的分子动力学模拟
6.分子动力学结果展示与解读
以水中的溶菌酶为例
第七天
蛋白-配体分子动力学模拟的执行
1.蛋白-配体在分子动力学模拟的处理流程
2.蛋白晶体的准备
3.蛋白-配体模拟初始构象的准备
4.配体分子力场拓扑文件的准备
4.1 高斯的简要介绍
4.2 ambertool的简要介绍
4.3生成小分子的力场参数文件
5.对复合物体系温度和压力分别限制的预平衡
6.无限制的分子动力学模拟
7.分子动力学结果展示与解读
8.轨迹后处理及分析
以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例
下方为部分案例图:
二、AIDD人工智能药物发现与设计
(第一天)
人工智能与药物发现
用工具的介绍与安装
从CADD到AIDD的介绍
1.计算机辅助药物设计(CADD)简介
1.2.分子对接与分子动力学背景介绍
1.3.人工智能药物发现(AIDD)简介
2.机器学习与深度学习在药物发现中的背景介绍
2.1药物发现与设计
2.2基于结构的药物发现与设计
2.3基于配体的药物发现与设计
3.1Anaconda3/Pycharm安装
3.2python 编程基础
3.3Pandas基础
3.4NumPy基础
3.5RDKit基础
3.6Pytorch基础
3.7Tensorflow基础
3.8DeepChem基础
(第二天)
机器学习与药物发现(分类任务)
1.分类模型的构建与应用
1.1逻辑回归算法原理
1.2朴素贝叶斯算法原理
1.3k最近邻算法原理
1.4支持向量机算法原理
1.5随机森林算法原理
1.6梯度提升算法原理
1.7多层感知机算法原理
1.8特征工程
1.9缺失值填补
2.特征归一化
2.1变量筛选
2.2模型评估方法
2.3交叉验证
2.4外部验证
3.分类模型的常用评价指标
3.1混淆矩阵
3.2准确率
3.3敏感性
3.4特异性
3.5模型选择
3.6格点搜索超参数调优
3.7k折交叉验证
分类模型的实例讲解与练习,以给定数据集为例,讲解基于以上机器学习算法的生物活性或ADMET性质预测模型。引导学员构建自己的数据模型,并用于小分子化合物的活性或ADMET性质预测。
(第三天)
机器学习与药物发现(回归任务)
1.随机森林回归
2.支持向量机回归
3.XGboost回归
4.多层感知机回归
5.神经网络回归
6.回归模型的常用评价指标
6.1MSE
6.2RMSE
6.3MAE
6.4R2
QSAR/3D-QSAR模型
以给定数据集为例,讲解基于上述几种机器学习算法构建生物活性如pIC50或ADMET性质预测模型。
(第四天)
深度学习与药物发现
1.深度学习的发展历程与在药物开发中的应用
1.1多层感知机/人工神经网络
1.2基于梯度的学习
1.3反向传播算法
1.4随机梯度下降
1.5卷积神经网络介绍
1.6图神经网络介绍
基于PyTorch的多层感知机算法的实例讲解与练习
以给定数据集为例,讲解基于多层感知机的化合物性质预测模型。
以给定数据集为例,讲解基于卷积神经网络的化合物图像预测分类模型。
以给定数据集为例,讲解基于图神经网络对化合物的毒性分类预测模型。
(第五天)
分子生成模型
1.生成式对抗网络(GANs)的基本原理
1.2生成器
1.3判别器
1.4循环神经网络(RNN)
1.5长短期记忆网络(LSTM)
2.基于上下文的循环神经网络序列建模
3.基于字符串的小分子化合物生成模型
4.基于图数据的小分子化合物生成模型
实例讲解与练习,以给定数据集为例,构建分子生成模型。
三、蛋白质晶体结构解析
第一天
蛋白质结晶前准备
1. 目的蛋白质信息检索(包括实操演示)
1.1 不同种属的蛋白
1.2 蛋白质一级结构的调查
1.3 蛋白质三级结构的预测
1.4 蛋白质理化特性的预测
1.5 蛋白质的配体和共价修饰
2. 分子克隆技术
2.1 目的基因的获取(包括实操演示)
2.2 目的基因的引物设计(包括实操演示)
2.3 传统克隆技术(涉及学习SnapGene软件,包括实操演示)
2.4 无缝克隆技术(涉及学习SnapGene软件,包括实操演示)
以某一基因进行操作演示
3. 利用大肠杆菌表达目的蛋白
3.1 目的蛋白的小量鉴定表达
3.2 目的蛋白的大量表达
3.3 收菌和裂解菌体
3.4 裂解液的离心
3.5 目的蛋白的浓缩
3.6 目的蛋白浓度的测定
4. 真核表达系统
第二天
蛋白质结晶技术
1. 蛋白晶体结构的特征
1.1 蛋白晶体的空间格子、晶胞和晶面指标
1.2 蛋白晶体的对称性、点群、晶系和空间群
2. 蛋白质晶体生长的理论知识(详细讲解温度、pH值、离子强度、有机溶剂、沉淀剂,等等,对蛋白晶体生长的影响;影响蛋白质晶型的因素)
3. 蛋白质晶体生长条件的初筛(详细讲解晶体初筛的注意事项)
4. 蛋白质晶体生长条件的优化 (详细讲解晶体优化的方法,包括改变pH值、沉淀剂,等因素)
5. 晶种法优化蛋白质晶体生长条件
6. 蛋白晶体的挑选和防冻液的配制
第三天
蛋白晶体衍射数据收集
1. X射线衍射
1.1. X射线衍射原理
1.2. X射线衍射的电子密度
1.3. 晶体结构解析的相角问题
2. 上海光源线站BL18U1、BL19U1和BL02U1收集数据的方法 (重点详细讲解,可能需要更长的时间)
3. 蛋白晶体结构解析软件的安装(包括Ubuntu系统、Phenix软件、CCP4软件、PyMoL软件、XDS软件和Adxv软件)
第四天
蛋白晶体结构解析
1.晶体结构的解析
1.1. 晶体结构解析流程
1.2. Index、Intergrate和Scale
1.3. 分子置换技术(包括实操演示)
1.4. 蛋白晶体结构的重建(包括实操演示)
1.5. 蛋白晶体结构的优化(包括实操演示)
2. 晶体结构的精修(涉及COOT软件、Phenix软件和CCP4软件,包括实操演示)
3. 晶体结构质量的评价指标(详细讲解各个评价指标)
4. 蛋白质结构中加入小分子配体
5. 在结构解析过程中,如何利用软件提高分辨率(重点讲解,需要较长的时间)
第五天
蛋白晶体结构的提交及展示
1. 从晶体生长到解析,详细剖析提高分辨率的方法(包括示例演示)
2. 蛋白晶体结构数据提交到PDB(包括实操演示)
3. 蛋白晶体结构的展示(包括实操演示)
六、时间
CADD计算机辅助药物设计
2023.7.29 -----2023.7.30 全天(上午09.00-11.30 下午13.30-17.00)
2023.8.1-----2023.8.4晚上(晚上19.00-22.00)
2023.8.5-----2023.8.6全天(上午09.00-11.30 下午13.30-17.00)
2023.8.8-----2023.8.9晚上(晚上19.00-22.00)
AIDD人工智能药物发现与设计
2023.8.5 -----2023.8.6 全天(上午09.00-11.30 下午13.30-17.00)
2023.8.8-----2023.8.9晚上(晚上19.00-22.00)
2023.8.12-----2023.8.13全天(上午09.00-11.30 下午13.30-17.00)
蛋白质晶体结构解析
2023.08.01----2023.08.04晚上(晚上19.00-22.00)
2023.08.05 -----2023.08.06 全天(上午09.00-11.30 下午13.30-17.00)
2023.08.08-----2023.08.09晚上(晚上19.00-22.00)
实操及科研问题
往期参会单位
有来自四川大学、中科院大学、上海交通大学、中国人民解放军海军军医大学、江南大学、中国农业大学、南昌大学、合肥工业大学、天津科技大学、华中农业大学、山东理工大学、北京工商大学、江苏大学、江南大学、大连工业大学、华南理工大学成都中医药大学、北京大学、浙江大学、中南大学、复旦大学、东北大学、国防科技大学、江苏海洋大学、华中科技大学、湖北大学、中国医学科学院、中南大学湘雅医院、中国药科大学、协和药物研究所、中国农业科学院基因组研究所、广州中医药大学、上海中医药大学、上海理工大学、北京中医药大学、武汉大学、香港大学、沈阳药科大学、山东中医药大学、宁波大学、山东大学、甘肃中医药大学、医学院附属仁济医院、中国医学科学院药物研究所、杭州医学院、广州医科大学附属肿瘤医院、中山大学孙逸仙纪念医院、江苏省中医院、中国中医科学院广安门医院、中山大学附属第五医院、中山大学中山眼科中心、汕头大学、扬州大学、天津科技大学、东南大学、上海应用技术大学、中国农业科学院深圳农业基因组研究所 、绍兴文理学院、乔治梅森大学、南京小飞象生物科技有限公司、加州大学、广东省科学院微生物研究所(广东省微生物分析检测中心)、山东绿叶制药有限公司、北京泰德制药股份有限公司、深圳龙昌新药研发有限公司、Osaka University、上海美迪西、防化研究院、国防科技创新研究院、北京安必奇生物科技有限公司、国家纳米科学中心、军事科学院防化研究院、南方科技大学、中国科学院化学研究所、中国农业科学院茶叶研究所、四川国康药业有限公司、南通药明康德医药科技有限公司、南京沛微生物科技有限公司、北京科诺信诚科技有限公司、天士力生物医药股份有限公司、泽达易盛(天津)科技股份有限公司、沈阳市青囊医疗科技有限责任公司、青岛科博源生物技术有限公司、中科聚研(吉林)干细胞科技有限公司、广州同隽医药科技有限公司、北京斯利安药业有限公司、上海韵和生物医药有限公司、北京英飞智药科技有限公司、上海森辉医药有限公司、上海倍勘生物技术有限公司、浙江海正股份有限公司等公司的四百余名工程师老师学生参会,还有许多因为时间冲突没法参加。这次,我们诚挚邀请您来参加!
这篇关于最新科研技术:CADD分子对接、虚拟筛选等/AIDD模型构建和数据分析能力/蛋白晶体结构解析:分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!