RNA-seq 比对软件STAR——(2)使用

2023-11-06 01:59
文章标签 使用 软件 star seq rna

本文主要是介绍RNA-seq 比对软件STAR——(2)使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

RNA-seq 比对软件STAR——(2)使用

一、参数说明

详见——>manual
(1) readFilesIn
要映射序列文件的名称(带路径),如果文件是压缩的文件使用readFilesCommand参数进行解压缩。如果是(*.gz)使用 --readFilesCommand zcat或 --readFilesCommand gunzip -c,对于bzip2压缩文件,使用–readFilesCommand bunzip2 -c

(2) outFileNamePrefix
输出文件的前缀(包含路径)

(3) outFilterMultimapNmax
一个read允许最多对齐数,超过认为read没有映射
max number of multiple alignments allowed for a read: if exceeded, the read is considered unmapped
(4) outSAMtype BAM SortedByCoordinate
生成的BAM文件排序
output sorted by coordinate Aligned.sortedByCoord.out.bam file, similar to samtools sort command. If this option causes problems, it is recommended to reduce
–outBAMsortingThreadN from the default 6 to lower values (as low as 1).
(5) outSAMattributes

  • NH:number of loci the reads maps to: =1 for unique mappers, >1 for multimappers. Standard SAM tag.
  • HI:multiple alignment index, starts with –outSAMattrIHstart (=1 by default). Standard SAM tag
  • NM:edit distance to the reference (number of mismatched + inserted +deleted bases) for each mate. Standard SAM tag.
  • MD:string encoding mismatched and deleted reference bases (see standard SAM specifications). Standard SAM tag.
  • XS:alignment strand according to –outSAMstrandField.
  • AS:multiple alignment index, starts with –outSAMattrIHstart (=1 by default). Standard SAM tag

二、index

STAR --runMode genomeGenerate --runThreadN 20 \
--genomeDir /share2/pub/yangjy/yangjy/database/STAR_index69 \
--outTmpDir /share2/pub/yangjy/yangjy/database/tmp \
--genomeFastaFiles /share/pub/wangxy/software/genome/ucsc/hg38/hg38.fa \
--sjdbGTFfile /share/pub/wangxy/Annotation/hg38/gencode.v34.annotation.gtf \
--sjdbOverhang 69

error 1
在这里插入图片描述
新版的STAR 需要写tmp路径,即增加参数 --outTmpDir ,而且这个路径必须不存在的!!,上面的STAR_index69必须是提前创建好的!!
error 2
在这里插入图片描述
如果想要像我上面这种方式写脚本,一定要注意在每个反斜杠后面不能有空格或者其他字符!否则它认不得!其实可以直接写一行,但是为了方便看参数,我习惯这样写了,你们根据自己的习惯!

result
在这里插入图片描述

三、mapping

for file in 'SRR11296675' 'SRR11296676' 'SRR11296677' 'SRR11296678' 'SRR11296679' 'SRR11296680' 'SRR11296681' 'SRR11296682'
do
echo $file
STAR  \
--runThreadN  40 \
--genomeDir /share2/pub/yangjy/yangjy/database/STAR_index69 \
--readFilesIn /share2/pub/yangjy/yangjy/rna-seq-data/GSE146887/fastq_data/$file.fastq \
--outFileNamePrefix /share2/pub/yangjy/yangjy/rna-seq-data/GSE146887/bbam/$file \
--outFilterMultimapNmax 500 \
--outSAMtype BAM SortedByCoordinate \
--outSAMattributes NH HI NM MD XS AS     
done

result
在这里插入图片描述
用过老版本的,新版本真的快很多很多~

这篇关于RNA-seq 比对软件STAR——(2)使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/353843

相关文章

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景