本文主要是介绍RNA-seq 上游实战排坑记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
RNA-seq 上游实战&排坑记录
一.流程总览
(每个流程几乎包括参数详解,代码,结果,报错,注意)
01.安装conda
02.安装软件
03.数据下载
04.sra to fastq
05.fastqc质控
06.Trim(除去低质量碱基和接头)
07.Hisat2 Mapping
08.sam to bam(格式转换,排序,建立索引,查看reads比对情况)
09.bam to featurecounts
二.环境/文件
1.阿里云2核16G型云服务器,300G高效云盘;
2.Hisat2官网人类基因组索引文件
3.基因组注释文件
4.PRJNA497524,人骨肉瘤细胞中某个基因缺失与野生型各两个样本的转录组测序数据。
三.实战步骤,报错,处理,结果
01.安装conda
安装流程 | 详见技能树连接,踩雷率较低,按照流程一步步来即可。https://www.jianshu.com/p/a84cd44bac67 |
---|---|
参数详解 | https://www.jianshu.com/p/ce8af4e7869d |
02.安装软件
安装流程 | 代码参见https://www.jianshu.com/p/a84cd44bac67但本次实战橘色标出的软件未用到,且tophat安装出现报错 |
---|
报错 | 因为python环境引发的报错 |
---|
03.SRR数据下载
由于prefetch下载极慢,按技能树推荐,采用Aspera。
Aspera安装 | 步骤详见https://blog.csdn.net/weixin_44879403/article/details/106489201 |
---|---|
参数详解 | 其重要参数如“-I,-P等”详见 https://www.jianshu.com/p/dc2252fab020 |
报错及解决:
- 安装aspera不能在root用户
解决:创建新用户,详见 https://blog.csdn.net/weixin_37182342/article/details/80298464
这篇关于RNA-seq 上游实战排坑记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!