RNA-seq分析(Fastqc+Trimmomatic+STAR+HTseq-count+DESeq2)

2024-03-28 21:18

本文主要是介绍RNA-seq分析(Fastqc+Trimmomatic+STAR+HTseq-count+DESeq2),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近做RNA-seq,正好把流程整理下,也希望分享和相互学习。
具体将以Fastqc + Trimmomatic + STAR + HTseq-count + DEseq2的流程来进行。

查看数据完整性

for dir in `ls`; do cd $dir; md5sum -c MD5_*txt; cd ..; done

预处理

FastQC + Trimmomatic

fastqc -t 5 sample_R1.fq.gz
fastqc -t 5 sample_R2.fq.gz
java -jar ~/tools/Trimmomatic/Trimmomatic-0.36/trimmomatic-0.36.jar PE -threads 20 sample_R1.fq.gz sample_R2.fq.gz -baseout sample_filtered.fq.gz ILLUMINACLIP:~/tools/Trimmomatic/Trimmomatic-0.36/adapters/TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 HEADCROP:8 MINLEN:36 HEADCROP:15

fastqc后发现有些样本per tile sequence content 1,Per base sequence content,Adapter Content,Kmer Content没有通过。主要问题是去除些质量差的reads;根据前15个左右碱基比不均一,用HEADCROP去掉。用的是TruSeq的adapter,故而加上,用Trimmomatic。
Trimmomatic相关学习内容,见2,3.4.

STAR

make index
人和小鼠的基因组和参考注释用Tophat的igenomes下:

STAR --runThreadN 30 --runMode genomeGenerate --genomeDir STARINDEX_20180118/ --genomeFastaFiles WholeGenomeFasta/genome.fa --sjdbGTFfile ../Annotation/Genes/genes.gtf --sjdbOverhang 134

do the alignment.
可以基于第一次比对的结果,用SJ.out.tab于重新Genome的Index,然后再比对(在用找SNP和Indel时尤其推荐)。7

STAR --runThreadN 30 --genomeDir ~/Ref/UCSC_hg19/Homo_sapiens/UCSC/hg19/Sequence/STARIndex_20180118 --readFilesIn sample_filtered_1P.fq.gz sample_filtered_2P.fq.gz --outFileNamePrefix ./Hs_treat3/Hs_treat3 --readFilesCommand zcat

参考内容:5, 6,
Trim reads map to multiple regions.

samtools view -bS -F 4 Hs_treat3Aligned.out.sam > Hs_treat3_mapped.bam
samtools sort -n Hs_treat3_mapped.bam Hs_treat3_sort

HTSeq

用htseq-count计算read counts。8,9

htseq-count -f bam -s no Hs_treat3_sort.bam ~/Ref/UCSC_hg19/Homo_sapiens/UCSC/hg19/Annotation/Genes/genes.gtf > sample.count

DESeq2差异分析

library(DESeq2)
condition <- factor(c("A","A","B","B"))
dds <- DESeqDataSetFromMatrix(hs, DataFrame(condition), ~ condition)
dds <- dds[ rowSums(counts(dds)) > 1, ]   #过滤low count数据
nrow(dds)
dds <- DESeq(dds)     #差异分析
res <- results(dds)   #用result()函数获取结果
summary(res)  #summary()函数统计结果
count_r <- counts(dds, normalized=T)  #提取normalized count matrix

10

这篇关于RNA-seq分析(Fastqc+Trimmomatic+STAR+HTseq-count+DESeq2)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/856718

相关文章

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

C++ 各种map特点对比分析

《C++各种map特点对比分析》文章比较了C++中不同类型的map(如std::map,std::unordered_map,std::multimap,std::unordered_multima... 目录特点比较C++ 示例代码 ​​​​​​代码解释特点比较1. std::map底层实现:基于红黑

Spring、Spring Boot、Spring Cloud 的区别与联系分析

《Spring、SpringBoot、SpringCloud的区别与联系分析》Spring、SpringBoot和SpringCloud是Java开发中常用的框架,分别针对企业级应用开发、快速开... 目录1. Spring 框架2. Spring Boot3. Spring Cloud总结1. Sprin

Spring 中 BeanFactoryPostProcessor 的作用和示例源码分析

《Spring中BeanFactoryPostProcessor的作用和示例源码分析》Spring的BeanFactoryPostProcessor是容器初始化的扩展接口,允许在Bean实例化前... 目录一、概览1. 核心定位2. 核心功能详解3. 关键特性二、Spring 内置的 BeanFactory

MyBatis-Plus中Service接口的lambdaUpdate用法及实例分析

《MyBatis-Plus中Service接口的lambdaUpdate用法及实例分析》本文将详细讲解MyBatis-Plus中的lambdaUpdate用法,并提供丰富的案例来帮助读者更好地理解和应... 目录深入探索MyBATis-Plus中Service接口的lambdaUpdate用法及示例案例背景

MyBatis-Plus中静态工具Db的多种用法及实例分析

《MyBatis-Plus中静态工具Db的多种用法及实例分析》本文将详细讲解MyBatis-Plus中静态工具Db的各种用法,并结合具体案例进行演示和说明,具有很好的参考价值,希望对大家有所帮助,如有... 目录MyBATis-Plus中静态工具Db的多种用法及实例案例背景使用静态工具Db进行数据库操作插入

Go使用pprof进行CPU,内存和阻塞情况分析

《Go使用pprof进行CPU,内存和阻塞情况分析》Go语言提供了强大的pprof工具,用于分析CPU、内存、Goroutine阻塞等性能问题,帮助开发者优化程序,提高运行效率,下面我们就来深入了解下... 目录1. pprof 介绍2. 快速上手:启用 pprof3. CPU Profiling:分析 C

MySQL表锁、页面锁和行锁的作用及其优缺点对比分析

《MySQL表锁、页面锁和行锁的作用及其优缺点对比分析》MySQL中的表锁、页面锁和行锁各有特点,适用于不同的场景,表锁锁定整个表,适用于批量操作和MyISAM存储引擎,页面锁锁定数据页,适用于旧版本... 目录1. 表锁(Table Lock)2. 页面锁(Page Lock)3. 行锁(Row Lock