RNA-seq 比对软件STAR——(2)使用

2023-11-06 01:59
文章标签 使用 软件 star seq rna

本文主要是介绍RNA-seq 比对软件STAR——(2)使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

RNA-seq 比对软件STAR——(2)使用

一、参数说明

详见——>manual
(1) readFilesIn
要映射序列文件的名称(带路径),如果文件是压缩的文件使用readFilesCommand参数进行解压缩。如果是(*.gz)使用 --readFilesCommand zcat或 --readFilesCommand gunzip -c,对于bzip2压缩文件,使用–readFilesCommand bunzip2 -c

(2) outFileNamePrefix
输出文件的前缀(包含路径)

(3) outFilterMultimapNmax
一个read允许最多对齐数,超过认为read没有映射
max number of multiple alignments allowed for a read: if exceeded, the read is considered unmapped
(4) outSAMtype BAM SortedByCoordinate
生成的BAM文件排序
output sorted by coordinate Aligned.sortedByCoord.out.bam file, similar to samtools sort command. If this option causes problems, it is recommended to reduce
–outBAMsortingThreadN from the default 6 to lower values (as low as 1).
(5) outSAMattributes

  • NH:number of loci the reads maps to: =1 for unique mappers, >1 for multimappers. Standard SAM tag.
  • HI:multiple alignment index, starts with –outSAMattrIHstart (=1 by default). Standard SAM tag
  • NM:edit distance to the reference (number of mismatched + inserted +deleted bases) for each mate. Standard SAM tag.
  • MD:string encoding mismatched and deleted reference bases (see standard SAM specifications). Standard SAM tag.
  • XS:alignment strand according to –outSAMstrandField.
  • AS:multiple alignment index, starts with –outSAMattrIHstart (=1 by default). Standard SAM tag

二、index

STAR --runMode genomeGenerate --runThreadN 20 \
--genomeDir /share2/pub/yangjy/yangjy/database/STAR_index69 \
--outTmpDir /share2/pub/yangjy/yangjy/database/tmp \
--genomeFastaFiles /share/pub/wangxy/software/genome/ucsc/hg38/hg38.fa \
--sjdbGTFfile /share/pub/wangxy/Annotation/hg38/gencode.v34.annotation.gtf \
--sjdbOverhang 69

error 1
在这里插入图片描述
新版的STAR 需要写tmp路径,即增加参数 --outTmpDir ,而且这个路径必须不存在的!!,上面的STAR_index69必须是提前创建好的!!
error 2
在这里插入图片描述
如果想要像我上面这种方式写脚本,一定要注意在每个反斜杠后面不能有空格或者其他字符!否则它认不得!其实可以直接写一行,但是为了方便看参数,我习惯这样写了,你们根据自己的习惯!

result
在这里插入图片描述

三、mapping

for file in 'SRR11296675' 'SRR11296676' 'SRR11296677' 'SRR11296678' 'SRR11296679' 'SRR11296680' 'SRR11296681' 'SRR11296682'
do
echo $file
STAR  \
--runThreadN  40 \
--genomeDir /share2/pub/yangjy/yangjy/database/STAR_index69 \
--readFilesIn /share2/pub/yangjy/yangjy/rna-seq-data/GSE146887/fastq_data/$file.fastq \
--outFileNamePrefix /share2/pub/yangjy/yangjy/rna-seq-data/GSE146887/bbam/$file \
--outFilterMultimapNmax 500 \
--outSAMtype BAM SortedByCoordinate \
--outSAMattributes NH HI NM MD XS AS     
done

result
在这里插入图片描述
用过老版本的,新版本真的快很多很多~

这篇关于RNA-seq 比对软件STAR——(2)使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/353843

相关文章

Mybatis官方生成器的使用方式

《Mybatis官方生成器的使用方式》本文详细介绍了MyBatisGenerator(MBG)的使用方法,通过实际代码示例展示了如何配置Maven插件来自动化生成MyBatis项目所需的实体类、Map... 目录1. MyBATis Generator 简介2. MyBatis Generator 的功能3

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

Python使用qrcode库实现生成二维码的操作指南

《Python使用qrcode库实现生成二维码的操作指南》二维码是一种广泛使用的二维条码,因其高效的数据存储能力和易于扫描的特点,广泛应用于支付、身份验证、营销推广等领域,Pythonqrcode库是... 目录一、安装 python qrcode 库二、基本使用方法1. 生成简单二维码2. 生成带 Log

Python如何使用seleniumwire接管Chrome查看控制台中参数

《Python如何使用seleniumwire接管Chrome查看控制台中参数》文章介绍了如何使用Python的seleniumwire库来接管Chrome浏览器,并通过控制台查看接口参数,本文给大家... 1、cmd打开控制台,启动谷歌并制定端口号,找不到文件的加环境变量chrome.exe --rem

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

redis-cli命令行工具的使用小结

《redis-cli命令行工具的使用小结》redis-cli是Redis的命令行客户端,支持多种参数用于连接、操作和管理Redis数据库,本文给大家介绍redis-cli命令行工具的使用小结,感兴趣的... 目录基本连接参数基本连接方式连接远程服务器带密码连接操作与格式参数-r参数重复执行命令-i参数指定命

PyTorch使用教程之Tensor包详解

《PyTorch使用教程之Tensor包详解》这篇文章介绍了PyTorch中的张量(Tensor)数据结构,包括张量的数据类型、初始化、常用操作、属性等,张量是PyTorch框架中的核心数据结构,支持... 目录1、张量Tensor2、数据类型3、初始化(构造张量)4、常用操作5、常用属性5.1 存储(st