在Jupyter-lab中使用RDKit画分子2D图

2024-03-04 00:44
文章标签 使用 jupyter 分子 2d lab rdkit

本文主要是介绍在Jupyter-lab中使用RDKit画分子2D图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在Jupyter-lab中使用RDKit画分子2D图

在做完分子对接后,想看看筛选后的分子的结构。因此想利用Jupyter-lab来画分子的2D图。

1. 安装Jupyter-lab与RDKit

  • 系统:Win11
  • 已安装conda

RDKit 是一个功能强大、灵活易用的化学信息学工具包,广泛应用于药物发现、化学生物学、材料科学等领域。RDKit 提供了丰富的化学信息可视化功能,用户可以通过RDKit 生成分子结构图、化学反应图、药物分子的三维结构等,方便进行结果展示和分析。

1.1 安装RDKit

#创建并安装RDKit的conda环境
conda create -c conda-forge -n my-rdkit-env rdkit#激活RDKit的虚拟环境
conda activate my-rdkit-env

不知道为啥,这一步很慢,不知道是不是conda channel的问题。但总归是等了一段时间就成功了。参考自官方教程。

1.2 安装Jupyter-lab

Jupyter Lab是Jupyter Notebook的升级版本,可以一个窗口中同时打开多个 Notebook、代码编辑器、终端、文件浏览器等,更方便地进行多任务处理和工作流程管理。Jupyter Lab集成了丰富的文档编辑器,包括 Markdown、LaTeX 等,用户可以方便地编写和编辑文档,同时可以通过插件支持更多的文档格式和扩展功能。最主要的是Jupyter Lab提供了丰富的可视化功能,用户可以通过插件支持各种图表库和数据可视化工具,实现更丰富和复杂的数据分析和可视化。

使用pip安装

pip install jupyterlab

参考自官方安装教程。

2. 小分子(SDF格式)作图

2.1 画单个SDF格式的分子图

以他莫昔芬(Tamoxifen)小分子为例,首先从PubChem网站下载该分子的三维结构的SDF结构文件。
在这里插入图片描述
如法炮制,再下载其余三个小分子:阿司匹林(Aspirin),莫洛昔康(Molnupiravir),瑞德西韦(Remdesivir)。将四个分子保存在sdf/文件夹中。

在CMD中跳转至cd sdf/文件夹路径下,打开Jupyter-lab

from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit.Chem import Draw#读取sdf文件
m1 = Chem.MolFromMolFile('sdf/Conformer3D_COMPOUND_CID_121304016.sdf')#通过调用AllChem.Compute2DCoords(m1)计算出m1分子相应的二维坐标,并将其更新到分子对象中
AllChem.Compute2DCoords(m1)#判断m1分子是否读取成功
m1 is None#Draw.MolToImage()函数画出分子的2D图像
Draw.MolToImage(m1)

运行后结果如下:
在这里插入图片描述

  • 读取单个的SDF文件可以用Chem.MolFromMolFile(),尽管这个主要用于读取MOL格式的分子文件。
  • 读取一个存有多个分子集的SDF文件,主要用Chem.SDMolSupplier()
  • Chem.MolFromMolFile()无法读取PDB格式的分子文件,因此小分子文件读取主推SDF格式

2.2 画多个SDF格式的分子图

读取sdf/文件夹下的多个SDF分子,且将分子的2D图放在一张图中。

import os
import glob# 指定小分子的存储路径
path = r'sdf/'# 使用os.path.join构建路径,获取所有.sdf文件的路径列表
sdf_files = glob.glob(os.path.join(path, '*.sdf'))# 将所有.sdf文件保存在一个列表ms中
ms = []
for sdf_file in sdf_files:m = Chem.MolFromMolFile(sdf_file)ms.append(m)#计算出列表中分子的二维坐标,并将其更新到分子对象中  
for m in ms: tmp=AllChem.Compute2DCoords(m)# MolsToGridImage()函数可以将4个分子画在一张图上
# molsPerRow=4参数设置4个小分子并排成一列
# subImgSize=(500,500)设置每个小分子的图像尺寸为500x500大小
# legends=x.GetProp("_Name")获取小分子的名称作为图例
img=Draw.MolsToGridImage(ms[:4],molsPerRow=4,subImgSize=(500,500),legends=[x.GetProp("_Name") for x in ms[:4]], returnPNG=False) # 保存分子图像为PNG格式文件在sdf/文件夹下
img.save('./Mol_4.png')img

结果如下所示:
在这里插入图片描述
Draw.MolsToGridImage函数中设置returnPNG=False参数,主要用于在保存画出的图片时img.save()的报错:


AttributeError Traceback (most recent call last) Cell In[23], line 20
17 for m in ms: tmp=AllChem.Compute2DCoords(m)
19 img=Draw.MolsToGridImage(ms[:4],molsPerRow=4,subImgSize=(500,500),legends=[x.GetProp(“_Name”)
for x in ms[:4]])
—> 20 img.save(‘./Mol12_20.png’)
21 img

AttributeError: ‘Image’ object has no attribute ‘save’

这篇关于在Jupyter-lab中使用RDKit画分子2D图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/771473

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57