Single-cell 10x Cell Ranger analysis

2023-11-06 15:12
文章标签 cell single analysis ranger 10x

本文主要是介绍Single-cell 10x Cell Ranger analysis,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

first step download SRR data

#这是批量下载
nohup prefetch -X 100GB --option-file SRR_Acc_List.txt & 
nohup fastq-dump --gzip --split-files -A ./SRR13633760  -O /home/scRNA/ &

next Build a custom reference using Cell Ranger mkref

首先,找到您物种的参考基因组 FASTA 和 GTF 文件。如果该物种可从 Ensembl 数据库中获得,我们建议使用那里的文件。来自 Ensembl 的 GTF 文件包含可选标签,使过滤变得容易。如果 Ensembl 无法获得您感兴趣的物种,也可以使用其他来源的 GTF 和 FASTA 文件。请注意,GTF 文件是必需的,而不支持 GFF 文件。(请参阅 GFF/GTF 文件格式 - 定义和支持的选项)

这个是 Ensembl 的链接,进行选取物种进行制作参考基因组文件

在这里插入图片描述

这里以大鼠进行演示

分别打开图中的红色框中的内容
在这里插入图片描述

点击红色框中的内容

在这里插入图片描述

选取选择了顶级的FASTA文件下载

在这里插入图片描述

到这里已经完成第一个文件的下载,下面展示第二个文件下载,需要打开下面图的框,选择Download GTF

在这里插入图片描述

选择这个下载

在这里插入图片描述

至此我们全部完成下载内容

接下来进行构建参考基因组

这一步不是在我理解不是非必要,在做一些分析时,可以根据这个排除以基因,例如 仅添加–attribute=gene_biotype:protein_coding 只做编码蛋白在所有细胞中的分析

看一下说明

(base) hwsw@shpc-2596-instance-GkVAxmvG:~$ $cellranger mkgtf
Usage:mkgtf <input_gtf> <output_gtf> [--attribute=KEY:VALUE...]mkgtf -h | --help | --version
(base) hwsw@shpc-2596-instance-GkVAxmvG:~$ $cellranger mkgtf -h
Genes GTF tool for 10x Genomics Cell Ranger.Filter user-supplied GTF files for use as Cell Ranger-compatible
genes files for mkref tool.The commands below should be preceded by 'cellranger':Usage:mkgtf <input_gtf> <output_gtf> [--attribute=KEY:VALUE...]mkgtf -h | --help | --versionArguments:input_gtf           Path to input genes GTF file.output_gtf          Path to filtered output genes GTF file.Options:--attribute=<key:value>Key-value pair in attributes field to be kept in the GTFfile.-h --help           Show this message.--version           Show version.

这个是选择想要的表型然后进行过滤

#Filter GTF
cellranger=/home/hwsw/cellranger-7.1.0/cellranger 
$cellranger mkgtf \
Rattus_norvegicus.mRatBN7.2.105.gtf Rattus_norvegicus.mRatBN7.2.105.filtered.gtf \
--attribute=gene_biotype:protein_coding \
--attribute=gene_biotype:lncRNA \
--attribute=gene_biotype:antisense \
--attribute=gene_biotype:IG_LV_gene \
--attribute=gene_biotype:IG_V_gene \
--attribute=gene_biotype:IG_V_pseudogene \
--attribute=gene_biotype:IG_D_gene \
--attribute=gene_biotype:IG_J_gene \
--attribute=gene_biotype:IG_J_pseudogene \
--attribute=gene_biotype:IG_C_gene \
--attribute=gene_biotype:IG_C_pseudogene \
--attribute=gene_biotype:TR_V_gene \
--attribute=gene_biotype:TR_V_pseudogene \
--attribute=gene_biotype:TR_D_gene \
--attribute=gene_biotype:TR_J_gene \
--attribute=gene_biotype:TR_J_pseudogene \
--attribute=gene_biotype:TR_C_gene

准备单细胞分析参考基因组

cellranger mkref --help 查看命令参数

Reference preparation tool for 10x Genomics Cell Ranger.Build a Cell Ranger-compatible reference folder from user-supplied genome FASTA and gene GTF files. Creates a new folder named after the genome.The commands below should be preceded by 'cellranger':Usage:mkref--genome=NAME ...--fasta=PATH ...--genes=PATH ...[options]mkref -h | --help | --versionArguments:genome  #输出文件夹      Unique genome name(s), used to name output folder[a-zA-Z0-9_-]+. Specify multiple genomes byspecifying the --genome argument multiple times; theoutput folder will be <name1>_and_<name2>.fasta   #FASTA参考基因组绝对路径 Path(s) to FASTA file containing your genome reference.Specify multiple genomes by specifying the --fastaargument multiple times.genes   #.filtered.gtf注释文件绝对路径Path(s) to genes GTF file(S) containing annotated genesfor your genome reference. Specify multiple genomesby specifying the --genes argument multiple times.Options:--nthreads=<num>    This option is currently ignored due to a bug, and will be re-enabledin the next Cell Ranger release.--memgb=<num>       Maximum memory (GB) used when aligning reads with STAR.Defaults to 16.--ref-version=<str> Optional reference version string to include withreference.-h --help           Show this message.--version           Show version.

进行分析时间很长花费2-3小时

#Run mkref
cellranger mkref \
--genome=mRatBN7 \
--fasta=Rattus_norvegicus.mRatBN7.2.dna.toplevel.fa \
--genes=Rattus_norvegicus.mRatBN7.2.110.filtered.gtf \
--ref-version=1.0.0

我截取别人图运行截图

Apr 15 14:36:45 ..... started STAR run
Apr 15 14:36:45 ... starting to generate Genome files
Apr 15 14:38:52 ... starting to sort Suffix Array. This may take a long time...
Apr 15 14:39:03 ... sorting Suffix Array chunks and saving them to disk...
Apr 15 16:40:45 ... loading chunks from disk, packing SA...
Apr 15 16:41:47 ... finished generating suffix array
Apr 15 16:41:47 ... generating Suffix Array index
Apr 15 16:46:07 ... completed Suffix Array index
Apr 15 16:46:07 ..... processing annotations GTF
Apr 15 16:46:19 ..... inserting junctions into the genome indices
Apr 15 16:55:08 ... writing Genome to disk ...
Apr 15 16:55:23 ... writing Suffix Array to disk ...
Apr 15 16:56:00 ... writing SAindex to disk
Apr 15 16:56:08 ..... finished successfully
Creating new reference folder at /home/hanjiangang/single_Cell/example/ref/ovis_aries/ovis_aries
...doneWriting genome FASTA file into reference folder...
...doneIndexing genome FASTA file...
...doneWriting genes GTF file into reference folder...
...doneGenerating STAR genome index (may take over 8 core hours for a 3Gb genome)...
...done.Writing genome metadata JSON file into reference folder...
Computing hash of genome FASTA file...
...doneComputing hash of genes GTF file...
...done...done>>> Reference successfully created! <<<
You can now specify this reference on the command line:
cellranger --transcriptome=/home/hanjiangang/single_Cell/example/ref/ovis_aries/ovis_aries ..

这里面最后会生成–transcriptome=/home/hmsw/Rattus 这个文件夹

直接进行10x的标准流程

/home/hwsw/cellranger-7.1.0/cellranger count --id=SRR19145616 \
--transcriptome=/home/hwsw/Rattus \
--fastqs=/home/scRNA/SRR19145616 \
--sample=SRR19145616 \
--localcores=30 \
--localmem=300 \
--nosecondary 

这篇关于Single-cell 10x Cell Ranger analysis的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/357397

相关文章

cell phone teardown 手机拆卸

tweezer 镊子 screwdriver 螺丝刀 opening tool 开口工具 repair 修理 battery 电池 rear panel 后盖 front and rear cameras 前后摄像头 volume button board 音量键线路板 headphone jack 耳机孔 a cracked screen 破裂屏 otherwise non-functiona

Versioned Staged Flow-Sensitive Pointer Analysis

VSFS 1.Introduction2.Approach2.1.相关概念2.2.VSFS 3.Evaluation参考文献 1.Introduction 上一篇blog我介绍了目前flow-sensitive pointer analysis常用的SFS算法。相比IFDS-based方法,SFS显著通过稀疏分析提升了效率,但是其内部依旧有许多冗余计算,留下了很大优化空间。 以

[LeetCode] 137. Single Number II

题:https://leetcode.com/problems/single-number-ii/ 题目大意 给定array,其中有一个元素只出现了1次,其他元素都出现了3次。 思路 求和 减去 (set(array)*3 - array)/2 作为答案。 class Solution {public int singleNumber(int[] nums) {Set<Long> se

OpenCV_连通区域分析(Connected Component Analysis-Labeling)

申明:本文非笔者原创,原文转载自:http://blog.csdn.net/icvpr/article/details/10259577 OpenCV_连通区域分析(Connected Component Analysis/Labeling) 【摘要】 本文主要介绍在CVPR和图像处理领域中较为常用的一种图像区域(Blob)提取的方法——连通性分析法(连通区域标

猫猫学iOS 之微博项目实战(10)微博cell中图片的显示以及各种填充模式简介

猫猫分享,必须精品 原创文章,欢迎转载。转载请注明:翟乃玉的博客 地址:http://blog.csdn.net/u013357243 :一效果 如果直接设置会有拉伸等等的状况,这里主要介绍图片显示的一些细节 二:代码 代码实现其实很简单,微博当中用了一个photos来存放九宫格这些图片,然后用了一个photo类来做每个photo,并且在上面显示gif等的样式,很多很多小技巧,直接

【matlab】double和single类型

看到博客(这里)中说,在matlab中, 当数据比较大时,运算起来就困难了,有时候还会out of memory。原因是默认情况下matlab用double存储数据。而double数据类型占8个字节,single类型占4个字节。把数据类型从double类型转换成single类型可以节省一半的空间。(如果怀疑可以用whos指令查看)。本来很有道理的,但是看到有人说(比如这里):Th

如何得到自定义UITableViewCell中的按钮所在的cell的indexPath.row

在创建button的时候可以把indexpath的值给button.tag。点击的时候响应sender.tag. 在自定义UITableViewCell中创建了一个按钮。 想在点击该按钮时知道该按钮所在的cell在TableView中的行数。就是cell的 indexPath.row 两种方法都很好。 -(IBAction):(id)sender {

leetcode 136:Single Number

之前没有做过这类题,网上看到使用异或的方式 int singleNumber(std::vector<int>& nums) {int result=0;for(int i=0;i<nums.size();i++)result=result^nums[i];return result;}

MATH36022 Numerical Analysis 2 Approximation of Functions – Week 3 Exercises

Show that the Chebyshev polynomials are orthogonal on ( − 1 , 1 ) (−1, 1) (−1,1) with respect to the weight function ( 1 − x 2 ) − 1 / 2 (1 − x^2)^{−1/2} (1−x2)−1/2. Ans: T n ( x ) = cos ⁡ ( n arcc