Seurat 源码学习之VlnPlot

2023-10-08 07:40
文章标签 源码 学习 seurat vlnplot

本文主要是介绍Seurat 源码学习之VlnPlot,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天很好奇Seurat里的Vlnplot是怎么画的,花了一个上午研究一下这个画图,其实还是很简单的哈, 以官网的pbmc3k为例

#
library(dplyr)
library(Seurat)
library(patchwork)
setwd("/Users/xiaokangyu/Desktop/Seurat_raw_code/")
pbmc.data = Read10X("/Users/xiaokangyu/Desktop/test_dataset/pbmc_3k/filtered_gene_bc_matrices/hg19/")pbmc = CreateSeuratObject(counts = pbmc.data,project = "pbmc3k",min.cells=3,min.features = 200)
pbmcpbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")pbmc <- subset(pbmc, subset = nFeature_RNA > 200 & nFeature_RNA < 2500 & percent.mt < 5)pbmc <- NormalizeData(pbmc)pbmc <- FindVariableFeatures(pbmc, selection.method = "vst", nfeatures = 2000)all.genes <- rownames(pbmc)pbmc <- ScaleData(pbmc, features = all.genes)pbmc <- RunPCA(pbmc, features = VariableFeatures(object = pbmc))pbmc <- FindNeighbors(pbmc, dims = 1:10)pbmc <- FindClusters(pbmc, resolution = 0.5)pbmc <- RunUMAP(pbmc, dims = 1:10)new.cluster.ids <- c("Naive CD4 T", "Memory CD4 T", "CD14+ Mono", "B", "CD8 T", "FCGR3A+ Mono", "NK", "DC", "Platelet")names(new.cluster.ids) <- levels(pbmc)pbmc <- RenameIdents(pbmc, new.cluster.ids)pbmc[['cell_type']] <- pbmc@active.identlevels(pbmc)saveRDS(pbmc, file = "./pbmc.rds")# p =DimPlot(pbmc, reduction = "umap", group.by = "cell_type")#画batch图
# print(p)
# 
# pp=DimPlot(pbmc, reduction = "umap", group.by = "cell_type", label.size = 5,label=T)+ggtitle("annotated Celltype")+NoLegend()
# print(pp)
# 
# print(p+pp)
# p1=FeaturePlot(pbmc, features = c("MS4A1", "GNLY", "CD3E", "CD14", "FCER1A", "FCGR3A", "LYZ", "PPBP",
#                                   "CD8A"))
# 
# p2=FeaturePlot(pbmc, features = c("MS4A1", "CD79A"))
# print(p2)
# 
# p3=VlnPlot(pbmc, features = c("MS4A1", "CD79A"))p4 = VlnPlot(pbmc,features = c("MS4A1"))print(p4)
# pbmc@active.assay

结果如下
在这里插入图片描述在这里插入图片描述

可以看到这个结果很好哈,现在研究这个小提琴图是怎么画的

首先注意一点本地mac电脑可以直接调试,而服务器的rstudio打上断点后没有调试的相关按钮,很奇怪
在这里插入图片描述而在服务器上
在这里插入图片描述
注意在R里的调试有一个好处,虽然我直接安装了Seurat,直接使用调试按钮直接进入函数,但是python里有的包你是进不去的,首先进入的
在这里插入图片描述可以看到Vlnplot调用的是ExIplot函数,接着调用的是SingleExIPlot函数
在这里插入图片描述在这里插入图片描述这里可以看到真正的画图函数,代码还是很简单的

下面是我自己复现的代码

rm(list=ls())
library(Seurat)
library(ggplot2)
library(cowplot)pbmc = readRDS("./pbmc.rds")
set.seed(42)
feature ="MS4A1"
data_all = pbmc@assays$RNA@data # 取出来上dgcMatrix是稀疏矩阵,没法取行列
data_df = data.frame(data_all)
data = data.frame(t(data_df[feature,])) # 取feature 基因对应的表达
data$ident =pbmc@meta.data$cell_type # 我这里发现一个R的bug,就是对于因子类型的变量
#如果写入csv文件再读取,那么这个factor对应的level的顺序可能会自己变化,不再是开始保存时的结果了,
#如果要保存level对应的信息时,还是应该使用saveRDS而不是write.csvnoise <- rnorm(n = length(x = data[, feature]))/1e+05
data[, feature] <- data[, feature] + noisept.size = 0.1154295
x="ident"
y="`MS4A1`"
fill ="ident"
xlab="Identity"
feature = "MS4A1"
ylab ="Expression Level"jitter <- geom_jitter(height = 0, size = pt.size, show.legend = FALSE)
plot <- ggplot(data = data, mapping = aes_string(x = x, y = y, fill = fill)[c(2, 3, 1)]) + labs(x = xlab, y = ylab, title = feature, fill = NULL) + theme_cowplot() + theme(plot.title = element_text(hjust = 0.5))geom <- list(geom_violin(scale = "width", adjust = 1, trim = TRUE), theme(axis.text.x = element_text(angle = 45, hjust = 1)))plot <- do.call(what = "+", args = list(plot, geom))plot = plot + jitter
print(plot)

在这里插入图片描述这个结果和Seurat画出来的是一样的,嘿嘿

我的环境如下

sessionInfo()
R version 4.1.2 (2021-11-01)
Platform: x86_64-apple-darwin17.0 (64-bit)
Running under: macOS 13.1Matrix products: default
LAPACK: /Library/Frameworks/R.framework/Versions/4.1/Resources/lib/libRlapack.dyliblocale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8attached base packages:
[1] stats4    stats     graphics  grDevices utils     datasets  methods   base     other attached packages:[1] cowplot_1.1.1               patchwork_1.1.2             SeuratObject_4.1.3         [4] Seurat_4.3.0                dplyr_1.1.0                 ggplot2_3.4.1              [7] splatter_1.18.2             SingleCellExperiment_1.16.0 SummarizedExperiment_1.24.0
[10] Biobase_2.54.0              GenomicRanges_1.46.1        GenomeInfoDb_1.30.1        
[13] IRanges_2.28.0              S4Vectors_0.32.4            BiocGenerics_0.40.0        
[16] MatrixGenerics_1.6.0        matrixStats_0.63.0         loaded via a namespace (and not attached):[1] ggbeeswarm_0.7.1       Rtsne_0.16             colorspace_2.0-3      [4] deldir_1.0-6           ellipsis_0.3.2         ggridges_0.5.4        [7] XVector_0.34.0         rstudioapi_0.14        spatstat.data_3.0-0   [10] farver_2.1.1           leiden_0.4.3           listenv_0.9.0         [13] ggrepel_0.9.2          fansi_1.0.3            R.methodsS3_1.8.2     [16] codetools_0.2-18       splines_4.1.2          polyclip_1.10-4       [19] jsonlite_1.8.4         ica_1.0-3              cluster_2.1.2         [22] R.oo_1.25.0            png_0.1-8              uwot_0.1.14           [25] shiny_1.7.4            sctransform_0.3.5      spatstat.sparse_3.0-0 [28] compiler_4.1.2         httr_1.4.4             backports_1.4.1       [31] Matrix_1.5-1           fastmap_1.1.0          lazyeval_0.2.2        [34] cli_3.6.0              later_1.3.0            htmltools_0.5.4       [37] tools_4.1.2            igraph_1.3.5           gtable_0.3.1          [40] glue_1.6.2             GenomeInfoDbData_1.2.7 RANN_2.6.1            [43] reshape2_1.4.4         Rcpp_1.0.10            scattermore_0.8       [46] vctrs_0.5.2            spatstat.explore_3.0-5 nlme_3.1-153          [49] progressr_0.13.0       lmtest_0.9-40          spatstat.random_3.0-1 [52] stringr_1.5.0          globals_0.16.2         mime_0.12             [55] miniUI_0.1.1.1         lifecycle_1.0.3        irlba_2.3.5.1         [58] goftest_1.2-3          future_1.30.0          zlibbioc_1.40.0       [61] MASS_7.3-54            zoo_1.8-11             scales_1.2.1          [64] promises_1.2.0.1       spatstat.utils_3.0-1   parallel_4.1.2        [67] RColorBrewer_1.1-3     reticulate_1.27        pbapply_1.6-0         [70] gridExtra_2.3          ggrastr_1.0.1          stringi_1.7.8         [73] checkmate_2.1.0        BiocParallel_1.28.3    rlang_1.1.0           [76] pkgconfig_2.0.3        bitops_1.0-7           lattice_0.20-45       [79] ROCR_1.0-11            purrr_1.0.1            tensor_1.5            [82] labeling_0.4.2         htmlwidgets_1.6.1      tidyselect_1.2.0      [85] parallelly_1.33.0      RcppAnnoy_0.0.20       plyr_1.8.8            [88] magrittr_2.0.3         R6_2.5.1               generics_0.1.3        [91] DelayedArray_0.20.0    DBI_1.1.3              withr_2.5.0           [94] pillar_1.8.1           fitdistrplus_1.1-8     survival_3.2-13       [97] abind_1.4-5            RCurl_1.98-1.9         sp_1.5-1              
[100] tibble_3.2.1           future.apply_1.10.0    crayon_1.5.2          
[103] KernSmooth_2.23-20     utf8_1.2.2             spatstat.geom_3.0-3   
[106] plotly_4.10.1          locfit_1.5-9.7         grid_4.1.2            
[109] data.table_1.14.6      digest_0.6.31          xtable_1.8-4          
[112] tidyr_1.3.0            httpuv_1.6.7           R.utils_2.12.2        
[115] munsell_0.5.0          beeswarm_0.4.0         viridisLite_0.4.1     
[118] vipor_0.4.5     

这篇关于Seurat 源码学习之VlnPlot的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/163759

相关文章

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

Spring 中 BeanFactoryPostProcessor 的作用和示例源码分析

《Spring中BeanFactoryPostProcessor的作用和示例源码分析》Spring的BeanFactoryPostProcessor是容器初始化的扩展接口,允许在Bean实例化前... 目录一、概览1. 核心定位2. 核心功能详解3. 关键特性二、Spring 内置的 BeanFactory

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

Go中sync.Once源码的深度讲解

《Go中sync.Once源码的深度讲解》sync.Once是Go语言标准库中的一个同步原语,用于确保某个操作只执行一次,本文将从源码出发为大家详细介绍一下sync.Once的具体使用,x希望对大家有... 目录概念简单示例源码解读总结概念sync.Once是Go语言标准库中的一个同步原语,用于确保某个操

Java汇编源码如何查看环境搭建

《Java汇编源码如何查看环境搭建》:本文主要介绍如何在IntelliJIDEA开发环境中搭建字节码和汇编环境,以便更好地进行代码调优和JVM学习,首先,介绍了如何配置IntelliJIDEA以方... 目录一、简介二、在IDEA开发环境中搭建汇编环境2.1 在IDEA中搭建字节码查看环境2.1.1 搭建步

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;