CryoEM - 冷冻电镜聚类中心(2D Class)粒子图像的解析

2023-11-20 18:20

本文主要是介绍CryoEM - 冷冻电镜聚类中心(2D Class)粒子图像的解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/126244406

冷冻电镜粒子图像聚类:

  1. Import Particles:读取原始的冷冻电镜粒子图像

  2. 2D Class:2D聚类,获取聚类中心的清晰粒子图像

image-20220807235834719

下载图像的 聚类中心(MRC文件) 和 标签信息(CS文件):

  • MRC:cryosparc_P1_J12_020_class_averages.mrc
  • CS:cryosparc_P1_J12_020_particles.cs

image-20220808142238715

加载MRC文件函数:

def mrc_loader(mrc_path):"""加载MRC文件"""mrc = mrcfile.open(mrc_path, permissive=True)data = mrc.dataarr = np.zeros(shape=data.shape, dtype=data.dtype)arr[:] = data[:]return arr

解析MRC文件:

def mrc_parser(mrc_path, out_dir, is_log=False):"""读取MRC文件,获取Particle图像的最小、最大值,归一化,存储于输出文件夹:param mrc_path: MRC文件:param out_dir: 输出文件夹:param is_log: 日志:return: None"""arr = mrc_loader(mrc_path)i_min, i_max = np.min(arr), np.max(arr)for i in tqdm(range(arr.shape[0]), desc="particles"):img = np.squeeze(arr[i, :, :])img = (img - i_min) / (i_max - i_min)img = np.clip(img * 255., 0, 255)img = img.astype(np.uint8)out_path = os.path.join(out_dir, "{}.png".format(i))cv2.imwrite(out_path, img)if is_log:print(f"[Info] arr: {arr.shape}, i_min: {i_min}, i_max: {i_max}")print(f"[Info] out_dir: {out_dir}")

样本:

01234
image-20220808003133191image-20220808003159115image-20220808003204626image-20220808003210275image-20220808003218445

安装PyEM包,用于处理CS文件:参考 Install pyem with Miniconda

conda activate cryosparc-master
conda install numpy scipy matplotlib seaborn numba pandas natsort
conda install -c conda-forge pyfftw healpy pathos   # 安装速度较慢git clone https://github.com/asarnow/pyem.git
cd pyem
pip install --no-dependencies -e .

使用PyEM:参考 Export from cryoSPARC v2

运行脚本:

cd workspace/pyem
conda activate cryosparc-masterpython csparc2star.py cryosparc_P1_J12_020_particles.cs cryosparc_P1_J12_020_particles.star --relion2

数据,与待处理的particle图像,同名文件:

  • _rlnAnglePsi #2 :面内旋转,PSI(ψ),Peptide torsion angles:肽扭转角
  • _rlnClassNumber #15 :类别,1~50
  • 样本从第20行开始,4个head行+15个label行
000001@J11/imported/017214887957000494328_000000855321499642015_stack_1293_cor2_DW_particles.mrc 83.571426 -0.450000 -5.250000 300.000000 10000.000000 1.082500 13015.895508 12950.861328 9.064259 2.700000 0.000000 0.100000 0.000000 29
000002@J11/imported/017214887957000494328_000000855321499642015_stack_1293_cor2_DW_particles.mrc 254.387726 -2.550000 1.050000 300.000000 10000.000000 1.082500 12611.307617 12546.273438 9.064259 2.700000 0.000000 0.100000 0.000000 15

测试,图像旋转效果:

  • 原始路径:datasets/cryoEM/kongfang/Data/extract
  • 替换路径:去掉索引017214887957000494328
Data/extract/000000855321499642015_stack_1293_cor2_DW_particles.mrc

28聚类中心角度差异较大:

image-20220808144537732

测试Case:

000005@J11/imported/017214887957000494328_000000855321499642015_stack_1293_cor2_DW_particles.mrc 247.040802 -2.850000 0.750000 300.000000 10000.000000 1.082500 13292.802734 13227.768555 9.064259 2.700000 0.000000 0.100000 0.000000 28
000020@J11/imported/004046678624515756479_000077449707304157065_stack_2096_cor2_DW_particles.mrc 70.714287 -0.150000 0.750000 300.000000 10000.000000 1.082500 17615.394531 17506.113281 -3.673789 2.700000 0.000000 0.100000 0.000000 28

路径变换:

Data/extract/000000855321499642015_stack_1293_cor2_DW_particles.mrc

图像:

rawlowpassrotated center
image-20220808155257093image-20220808155244360image-20220808161714604

旋转聚类中心图像的源码:

def rotate(img, angle, out_wh=None):"""旋转粒子粒子图像,填充背景像素:param img: 待旋转的图像:param angle: 旋转角度,来源于_rlnAnglePsi,顺时针旋转:param out_wh: 输出尺寸:return: 旋转之后的图像"""h, w = img.shape[:2]bkg_val = int(np.argmax(np.bincount(img.flatten())))  # 背景像素,用于填充# 旋转图像img, _ = rotate_img_with_bound(img, 360-angle, border_value=bkg_val)# 截取图像中心img = center_crop(img, h, w)if out_wh:img = cv2.resize(img, out_wh)return img

这篇关于CryoEM - 冷冻电镜聚类中心(2D Class)粒子图像的解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/396530

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

多线程解析报表

假如有这样一个需求,当我们需要解析一个Excel里多个sheet的数据时,可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完之后,程序需要提示解析完成。 Way1 join import java.time.LocalTime;public class Main {public static void main(String[] args) thro

ZooKeeper 中的 Curator 框架解析

Apache ZooKeeper 是一个为分布式应用提供一致性服务的软件。它提供了诸如配置管理、分布式同步、组服务等功能。在使用 ZooKeeper 时,Curator 是一个非常流行的客户端库,它简化了 ZooKeeper 的使用,提供了高级的抽象和丰富的工具。本文将详细介绍 Curator 框架,包括它的设计哲学、核心组件以及如何使用 Curator 来简化 ZooKeeper 的操作。 1