tophat-fusion 鉴定融合基因

2023-10-09 03:20

本文主要是介绍tophat-fusion 鉴定融合基因,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

tophat-fusion 是一款利用RNA_seq 数据鉴定融合基因的工具,官网链接如下:

http://ccb.jhu.edu/software/tophat/fusion_index.shtml

安装:

tophat-fusion 是集成在tophat软件中的,具体的安装参考tophat的安装就好了

使用方法:

对于tophat-fusion 而言,要求固定的目录结构,比如我在result 文件夹下进行tophat-fusion的分析

那么我需要在该目录下准备几个文件:

1)物种对应的refGene.txt 和 ensGene.txt (这两个文件可以从UCSC下载得到)

2)  新建一个blast 文件夹,注意文件夹的名字必须为"blast", 在blast 文件夹下需要从NCBI下载 nt. human_genomic. other_genomic 开头的所有文件

下载的链接如下:

 

3)  tophat_fusion 的输出目录: 每个样本一个输出目录,输出目录的前缀为tophat_, 下划线之后加上样本名称,类似 tophat_MCF7;

当然你还需要物种对应的bowtie1 的索引文件,注意这里必须为bowtie1的索引,tophat 检测融合基因时推荐bowtie1的索引方式

 上述文件都准备好之后,就可以开始分析了;

第一步:toohat 比对,和普通的比对类似,只不过为了融合基因的检测,需要添加几个额外的参数:

tophat2 -o tophat_MCF7 -p 20  --fusion-search --keep-fasta-order  --bowtie1 --no-coverage-search -r 0 --mate-std-dev 80 --max-intron-length 100000 --fusion-min-dist 100000 --fusion-anchor-length 13 --fusion-ignore-chromosomes chrM hg19_bowtie1/hg19  SRR064286_1.fastq SRR064286_2.fastq

第二步:tophat-fusion-post , 生成融合基因的结果

tophat-fusion-post -p 20 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 hg19_bowtie1/hg19

需要指出的是,tophat-fusion-post 根据固定的目录结构进行样本,如果有多个样本,每个样本单独进行tophat 比对,只要输出目录区分开即可,比如A,B,C 3个样本,就有3个输出文件夹

tophat_A, tophat_B, tophat_C

运行完成之后,会生成一个名为 tophatfusion_out 的文件夹,该文件夹下是所有样本的融合基因分析的结果:

1)result.hml : 所有样本的融合基因分析的结果,直接看这个html

如上所示。在result.html 中,首先给出预测得到的融合基因,以表格形式进行展示,每列的含义如下:

1. Sample name in which a fusion is identified
2. Gene on the "left" side of the fusion
3. Chromosome ID on the left
4. Coordinates on the left
5. Gene on the "right" side
6. Chromosome ID on the right
7. Coordinates on the right
8. Number of spanning reads - this is the number of reads that span a fusion point all on their own. In other words, the read itself has a fusion break point within it.
9. Number of spanning mate pairs - this is the number of pairs of reads where one read maps entirely on the left and the other read maps entirely on the right of the fusion break point. Neither read is split, so these pairs are not counted at all in (8).
10. Number of spanning mate pairs where one end spans a fusion (reads spanning fusion with only a few bases are included).
If you follow the the 9th column, it shows coordinates "number1:number2" where one end is located at a distance of "number1" bases from the left genomic coordinate of a fusion and "number2" is similarly defined.

 

这篇关于tophat-fusion 鉴定融合基因的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/169987

相关文章

韦季李输入法_输入法和鼠标的深度融合

在数字化输入的新纪元,传统键盘输入方式正悄然进化。以往,面对实体键盘,我们常需目光游离于屏幕与键盘之间,以确认指尖下的精准位置。而屏幕键盘虽直观可见,却常因占据屏幕空间,迫使我们在操作与视野间做出妥协,频繁调整布局以兼顾输入与界面浏览。 幸而,韦季李输入法的横空出世,彻底颠覆了这一现状。它不仅对输入界面进行了革命性的重构,更巧妙地将鼠标这一传统外设融入其中,开创了一种前所未有的交互体验。 想象

AI和新基建赋能智慧工地超融合管理平台解决方案

1. 项目背景与需求 电力行业的工程管理正朝着智慧化发展,但目前仍处于起步阶段。为满足数字化、网络化、智能化的发展需求,需要构建一个高效综合监控平台,实现对电力项目全过程的精益化管控。 2. 综合管理平台的构建 该平台集成了超融合实景监控、安全智能监测、公共安全防范、技术管理、人员管控和绿色施工等多个方面,通过BIM协同优化设计,提升项目质量和进度管理。 3. 安全智能监测的重要性 安全

VMware Fusion Pro 13 Mac版虚拟机 安装Win11系统教程

Mac分享吧 文章目录 Win11安装完成,软件打开效果一、VMware安装Windows11虚拟机1️⃣:准备镜像2️⃣:创建虚拟机3️⃣:虚拟机设置4️⃣:安装虚拟机5️⃣:解决连不上网问题 安装完成!!! Win11安装完成,软件打开效果 一、VMware安装Windows11虚拟机 首先确保自己的mac开启了网络共享。不然虚拟机连不上👀的 1️⃣:准备镜像

临床基础两手抓!这个12+神经网络模型太贪了,免疫治疗预测、通路重要性、基因重要性、通路交互作用性全部拿下!

生信碱移 IRnet介绍 用于预测病人免疫治疗反应类型的生物过程嵌入神经网络,提供通路、通路交互、基因重要性的多重可解释性评估。 临床实践中常常遇到许多复杂的问题,常见的两种是: 二分类或多分类:预测患者对治疗有无耐受(二分类)、判断患者的疾病分级(多分类); 连续数值的预测:预测癌症病人的风险、预测患者的白细胞数值水平; 尽管传统的机器学习提供了高效的建模预测与初步的特征重

Banana Pi BPI-F3 进迭时空RISC-V架构下,AI融合算力及其软件栈实践

RISC-V架构下,AI融合算力及其软件栈实践 面对未来大模型(LLM)、AIGC等智能化浪潮的挑战,进迭时空在RISC-V方向全面布局,通过精心设计的RISC-V DSA架构以及软硬一体的优化策略,将全力为未来打造高效且易用的AI算力解决方案。目前,进迭时空已经取得了显著的进展,成功推出了第一个版本的智算核(带AI融合算力的智算CPU)以及配套的AI软件栈。 软件栈简介 AI算法部署旨

天然药物化学史话:“四大光谱”在天然产物结构鉴定中的应用-文献精读46

天然药物化学史话:“四大光谱”在天然产物结构鉴定中的应用,天然产物化学及其生物合成必备基础知识~ 摘要 天然产物化学研究在药物研发中起着非常重要的作用,结构研究又是天然产物化学研究中最重要的工作之一。在天然药物化学史话系列文章的基础上,对在天然产物结构研究中起绝对主导作用的“四大光谱”分析技术,即红外光谱、紫外光谱、质谱、核磁共振波谱在天然产物结构鉴定中的应用历史进行回顾与总结,并对其发展

下一代皮克斯:AI如何融合电影与游戏

故事是人类体验的核心,通过故事我们理解世界、寻找意义并与他人建立联系。技术的进步不断推动着故事叙述的形式,从迪士尼的多平面摄影机到皮克斯的3D图形技术,每一次技术革命都带来了故事叙述的新方式。 游戏:现代叙事的前沿 今天,有两个主要的趋势正在加速下一代叙事公司的诞生: 消费者转向互动媒体:过去三十年间,我们见证了消费者从传统的线性媒体(如电视和电影)向互动媒体(如游戏)的逐步迁移。对于Z世

VMware Fusion Pro 13 for Mac虚拟机软件

Mac分享吧 文章目录 效果一、下载软件二、开始安装安装完成!!! 效果 一、下载软件 下载软件 地址:www.macfxb.cn 二、开始安装 安装完成!!!

【OpenCV2.2】图像的算术与位运算(图像的加法运算、图像的减法运算、图像的融合)、OpenCV的位运算(非操作、与运算、或和异或)

1 图像的算术运算 1.1 图像的加法运算 1.2 图像的减法运算 1.3 图像的融合 2 OpenCV的位运算 2.1 非操作 2.2 与运算 2.3 或和异或 1 图像的算术运算 1.1 图像的加法运算 add opencv使用add来执行图像的加法运算 图片就是矩阵, 图片的加法运算就是矩阵的加法运算, 这就要求加法运算的两张图shape必须是相同的. # 图片加法imp

bedtools subtract 基因区段取差集

基本概述: bedtools subtract 通俗的说,得到 A - B 的区段。如果在A中发现了B区段,就把 B 扣除,通过不同的参数,扣除的标准不一样。其中,参数 -A 可以达成 Remove features with any overlap 的效果(第四行)。 使用方法: bedtools subtract [OPTIONS] -a <BED/GFF/VCF> -b <BE