JCVI-筛选blast最佳结果(生物信息学工具-015)

2024-04-17 03:04

本文主要是介绍JCVI-筛选blast最佳结果(生物信息学工具-015),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

通常,大家会问我们经过了NR注释,SwissProt注释,那么如何进行,如何挑选最佳比对结果?

同理,存在一个问题,如何挑选最佳的blast比对结果?什么事最优的同源序列?

唐海宝老师开发的工具jcvi(jcvi.formats.blast)解决了这一问题,基本上jcvi等价于MCscan。

01 安装

普通安装需要安装许多依赖,由于服务器等配置不能轻易修改,所以我们采用最便捷的方式安装jcvi-conda。

conda activate jcvipy  #创建环境
conda create -n jcvipy python==3.9 -c conda-forge    # -y   #==和=一样
python -m pip install --upgrade pip     #升级python包管理器
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple   #设置python包镜像源,国内源下载速度起飞
pip install -i https://xh//https://pypi.tuna.tsinghua.edu.cn/simple  jcvi    #安装jcvi
02 使用
用法:python -m jcvi.formats.blast ACTION可用的操作:anchors | 仅保留锚定文件中存在的BLAST配对annotate | 在BLAST制表文件中注释重叠类型annotation | 创建带有注释的制表文件bed | 从BLAST制表文件获取bed文件best | 获取每个查询的最佳BLAST匹配chain | 将相邻的HSPs链在一起completeness | 打印每个查询的完整性统计信息condense | 将相同查询-主体对的HSPs分组在一起covfilter | 过滤BLAST文件(基于id%和cov%)cscore | 为BLAST配对计算C分数filter | 过滤BLAST文件(基于分数、id%、alignlen)gaps | 查找相邻HSPs之间间隙大小的分布mismatches | 打印HSPs的不匹配直方图pairs | 打印BLAST制表文件的配对末端读取rbbh | 查找相互最佳的BLAST匹配score | 为每个查询序列累加分数sort | 将行按查询分组并按分数降序排序subset | 从一些查询和主体chr中提取匹配项summary | 提供id%和cov%的摘要信息swap | 在BLAST制表文件中交换查询和主体top10 | 计算最常见的10个匹配项JCVI 实用程序库 1.3.9 [版权所有(C)2010-2024,唐海宝]

比对参考数据库下载,或者自建库均可。

NCBI-nr数据库下载
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gzSwissProt,高质量的蛋白数据库下载,蛋白序列得到实验的验证
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/swissprot.gz通用蛋白质库资源
wget -c ftp://ftp.expasy.org/databases/uniprot/current_release/uniref/uniref90/uniref90.fasta.gz

参考

 Blast安装及使用-Blast+2.14.0(bioinfomatics tools-001)

diamond安装与使用-diamond-2.1.8(bioinfomatics tools-010)

建立DIAMOND或NCBI BLAST+索引
diamond makedb --in uniprot_plants.pep -d XXX.pep.db使用DIAMOND或NCBI BLAST+进行比对,线程加速 -p -t
diamond blastp -d ./XXX.pep.db -q XXXX.pep  --evalue 1e-5 > XXXX.blastp.outfmt6 -p 4从DIMAMOND或NCBI BLAST+的比对结果中筛选每个query的最佳subject
conda activate jcvipy
python -m jcvi.formats.blast -h
python -m jcvi.formats.blast best -n 1 XXXX.blastp.outfmt6 

jcvi即可帮助我们挑选最佳Hit!我们获取id和序列fasta文件后即可进行下游操作,如PCR等等。

03 参考文献

Tang H, Bowers JE, Wang X, Ming R, Alam M, Paterson AH. Synteny and collinearity in plant genomes. Science. 2008 Apr 25;320(5875):486-8. doi: 10.1126/science.1153917. PMID: 18436778.

Wang Y, Tang H, Debarry JD, Tan X, Li J, Wang X, Lee TH, Jin H, Marler B, Guo H, Kissinger JC, Paterson AH. MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity. Nucleic Acids Res. 2012 Apr;40(7):e49. doi: 10.1093/nar/gkr1293. Epub 2012 Jan 4. PMID: 22217600; PMCID: PMC3326336.

Tang H, Zhang X, Miao C, Zhang J, Ming R, Schnable JC, Schnable PS, Lyons E, Lu J. ALLMAPS: robust scaffold ordering based on multiple maps. Genome Biol. 2015 Jan 13;16(1):3. doi: 10.1186/s13059-014-0573-1. PMID: 25583564; PMCID: PMC4305236.

王英豪,余嘉鑫,唐海宝,等.  植物复杂基因组与泛基因组研究现状与展望    [J].  中国科学:生命科学,  2024,  54  (02):  233-246.  
雷文龙,雷思茹,陈帅,等.  纳米孔测序技术在基因组学中的应用研究进展    [J].  基因组学与应用生物学,  2023,  42  (03):  233-241.  DOI:10.13417/j.gab.042.000233.
钟伟民,张兴坦,赵茜,等.  三代测序PacBio在转录组研究中的应用    [J].  福建农林大学学报(自然科学版),  2018,  47  (05):  524-529.  DOI:10.13323/j.cnki.j.fafu(nat.sci.).2018.05.002.
 

这篇关于JCVI-筛选blast最佳结果(生物信息学工具-015)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/910626

相关文章

使用Java实现通用树形结构构建工具类

《使用Java实现通用树形结构构建工具类》这篇文章主要为大家详细介绍了如何使用Java实现通用树形结构构建工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录完整代码一、设计思想与核心功能二、核心实现原理1. 数据结构准备阶段2. 循环依赖检测算法3. 树形结构构建4. 搜索子

利用Python开发Markdown表格结构转换为Excel工具

《利用Python开发Markdown表格结构转换为Excel工具》在数据管理和文档编写过程中,我们经常使用Markdown来记录表格数据,但它没有Excel使用方便,所以本文将使用Python编写一... 目录1.完整代码2. 项目概述3. 代码解析3.1 依赖库3.2 GUI 设计3.3 解析 Mark

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

jvm调优常用命令行工具详解

《jvm调优常用命令行工具详解》:本文主要介绍jvm调优常用命令行工具的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一 jinfo命令查看参数1.1 查看jvm参数二 jstack命令2.1 查看现场堆栈信息三 jstat 实时查看堆内存,gc情况3.1

MySQL使用binlog2sql工具实现在线恢复数据功能

《MySQL使用binlog2sql工具实现在线恢复数据功能》binlog2sql是大众点评开源的一款用于解析MySQLbinlog的工具,根据不同选项,可以得到原始SQL、回滚SQL等,下面我们就来... 目录背景目标步骤准备工作恢复数据结果验证结论背景生产数据库执行 SQL 脚本,一般会经过正规的审批

Spring Boot中定时任务Cron表达式的终极指南最佳实践记录

《SpringBoot中定时任务Cron表达式的终极指南最佳实践记录》本文详细介绍了SpringBoot中定时任务的实现方法,特别是Cron表达式的使用技巧和高级用法,从基础语法到复杂场景,从快速启... 目录一、Cron表达式基础1.1 Cron表达式结构1.2 核心语法规则二、Spring Boot中定

基于Python开发批量提取Excel图片的小工具

《基于Python开发批量提取Excel图片的小工具》这篇文章主要为大家详细介绍了如何使用Python中的openpyxl库开发一个小工具,可以实现批量提取Excel图片,有需要的小伙伴可以参考一下... 目前有一个需求,就是批量读取当前目录下所有文件夹里的Excel文件,去获取出Excel文件中的图片,并

Java导入、导出excel用法步骤保姆级教程(附封装好的工具类)

《Java导入、导出excel用法步骤保姆级教程(附封装好的工具类)》:本文主要介绍Java导入、导出excel的相关资料,讲解了使用Java和ApachePOI库将数据导出为Excel文件,包括... 目录前言一、引入Apache POI依赖二、用法&步骤2.1 创建Excel的元素2.3 样式和字体2.

基于Python开发PDF转PNG的可视化工具

《基于Python开发PDF转PNG的可视化工具》在数字文档处理领域,PDF到图像格式的转换是常见需求,本文介绍如何利用Python的PyMuPDF库和Tkinter框架开发一个带图形界面的PDF转P... 目录一、引言二、功能特性三、技术架构1. 技术栈组成2. 系统架构javascript设计3.效果图

MyBatis-Plus中静态工具Db的多种用法及实例分析

《MyBatis-Plus中静态工具Db的多种用法及实例分析》本文将详细讲解MyBatis-Plus中静态工具Db的各种用法,并结合具体案例进行演示和说明,具有很好的参考价值,希望对大家有所帮助,如有... 目录MyBATis-Plus中静态工具Db的多种用法及实例案例背景使用静态工具Db进行数据库操作插入