Mol Plant | 华南农大夏瑞团队发表TBtools-II,为个性化生物数据分析提供解决方案...

本文主要是介绍Mol Plant | 华南农大夏瑞团队发表TBtools-II,为个性化生物数据分析提供解决方案...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

植物生物大数据分析是当前植物学研究的主要任务之一。为辅助更多植物科学家处理生物大数据,TBtools-I 应运而生,并于2020年08月发表于 Molecular Plant 期刊(Chen et al., 2020)。过去三年间,植物生物信息领域有长足发展,如涌现了较多物种的T2T基因组与单倍型基因组(Naish et al., 2021, Sun et al., 2022, Shang et al., 2023, Shi et al., 2023),同时伴随本地存储(固态硬盘,SSD)和计算资源(CPU甚至GPU)价格的进一步下降,更多人可以在本地电脑开展生物大数据分析,也因此带来了更多的个性化数据分析需求。TBtools-I 着力解决植物生物数据分析的共性需求,如序列操作,序列比对,基因集功能分析以及生物数据可视化等。随着软件用户群体持续增长,需求多样性丰富,TBtools-I 已有功能和模式无法良好应对(陈程杰 和 夏瑞, 2022)。

一方面,不同的用户对数据分析有着不同的需求,往往希望使用特定的工具或工作流程进行数据分析,以获得最佳结果。因此,越来越多的功能被建议纳入用户熟悉的 TBtools 软件中,以满足个性化数据分析不断增长的需求,例如来自不同测序策略(如ChIP-seq,DAP-seq,BSA-seq等)生成的不同NGS数据;另一方面,更多新功能的添加(自发布以来已新增100多个新功能),使工具包变得过于复杂和繁琐,稀释了 TBtools 最初关注的用户共性需求的功能,反过来使用户很难快速找到所需的功能。此外,作为一款桌面软件,软件体积变大会增加分发、安装和使用方面上的复杂性,进而影响整体鲁棒性。

为应对这一困境,2023年9月22日,华南农业大学园艺学院(亚热带农业生物资源保护与利用国家重点实验室)夏瑞团队在 Molecular Plant 在线发表了题为 TBtools-II: A "One for All, All for One" Bioinformatics Platform for Biological Big-data Mining 的研究论文,系统介绍和描述 TBtools 的新版本,即 TBtools-II。TBtools-II 在 TBtools-I 的基础上优化并新增了100+个功能,开发了插件(Plugin)模式并架设了插件仓库(Plugin Store)。基于此,解决了软件功能全面性与灵活性的主要冲突。

另外,受限于 TBtools 项目组的课题经验,绝大多数 TBtools 功能(包括项目组开发的功能)局限在常规分子生物学和基因组学领域,未能良好拓展到诸如群体遗传学,表观遗传学甚至单细胞组学等领域。最好的软件开发者往往是用户。借由插件模式和插件仓库的推出,TBtools-II 同步提供了简便的插件开发接口,使得用户可以直接依据自己的需求,灵活地开发出实用插件,继而在课题组内甚至在TBtools用户社区分享,让所有TBtools用户受益。从而使得TBtools 由“软件”模式逐步走向“平台”模式。

7fb94ea7c592478a1f279a0dd7fc80c0.png

https://doi.org/10.1016/j.molp.2023.09.010

“开发者即用户,用户即开发者”,TBtools-II 提出“我为人人,人人为我”的开发新理念,插件商店(Plugin Store)也应运而生。为辅助用户参与开发,项目团队开发并释放了一款辅助开发 TBtools 插件的插件 - “CLI Program Wrapper Creator”。在该插件中,用户可以通过简单的表单填写,将本地二进制程序、脚本以及相关依赖转变成一个可以用于分发的 TBtools 插件。同时插件可上传到插件商店,分享给所有 TBtools 用户使用。

1801fdaf56d4dfbb42b1f8b94624229a.png

图 1. TBtools-II 以及 插件模式

当前,TBtools 插件商店中已有 94 个插件,超过半数为 TBtools 用户开发,功能覆盖了生物文本处理和数据可视化等。论文中介绍了由两位用户(受邀作为 TBtools-II 论文共同作者)开发的用户常用插件:用于植物单细胞数据分析的 Single Cell Sequencing Seurat Shiny 以及用于基因共表达网络分析的 WGCNA Shiny。

0cfefab40ecd913c7e3a7a2cee4455b4.png

图 2. 用户常用插件功能示例(差异表达分析、单细胞数据分析以及共表达网络分析)

顺应用户生物育种工作需求,TBtools-II 同步引入了系列常见插件和功能,可以便捷完成基于比较基因组的结构变异检测、引物自动开发和电子PCR和核酸电泳模拟,支持了本地电脑重测序数据快速回帖和SNP/Indel检测,结果可同步用于 QTLs 鉴定(BSAseq)。为辅助用户更好了解相关功能,文稿给出了一个基于公开发表的番茄 BSAseq 数据(Soyk et al., 2019)的分析流程示例,详细步骤参考正文。

673dbc02e4b0af4843afa4dfbfbe94e5.png

图 3. 后基因组时代的生物育种数据分析插件(分子标记快速开发与QTLseq数据分析)

华南农业大学园艺学院夏瑞教授和陈程杰讲师为论文的通讯作者,陈程杰讲师为论文第一作者;TBtools项目组(吴亚、曾灶海、徐婧、刘元龙副教授、何业华教授),暨南大学李嘉威博士,河南大学王骁博士,中国热带科学院生物所冯筠庭博士以及湖南农业大学陈浩博士参与了软件优化建议、开发测试等工作。论文工作得到广东省重点研发、国家自然科学基金、国家重点研发等项目支持,同步致谢了华南农业大学夏瑞课题组、何业华课题组、徐春香课题组、贵阳沃奇生物、邵扬(华中农业大学)、赵齐(中山大学肿瘤防治中心)和曾健明(澳门大学)等在 TBtools 插件生态构件上的建议和帮助,以及数以万计的TBtools软件用户,尤其是>40名TBtools社群管理人员的贡献。

夏瑞课题组长期关注小RNA和园艺植物性别演化规律探索,以植物基因组和生物信息学为主要研究手段,并研发了系列广为认可生物软件:植物生物信息学数据下游分析的 TBtools(Chen et al., 2020);正选择位点分析 EasyCodeML(Gao et al., 2019);植物小RNA注释数据库 sRNAanno(Chen et al., 2021);无患子科植物基因组数据库Sapbase(Li et al., 未发表);植物小RNA组学数据分析一站式软件 sRNAminer 和基因组浏览器 IGV-sRNA(Li et al., 未发表)以及基因结构人工矫正软件 IGV-GSAman(Chen et al., 未发表)以及其他。

参考文献

陈程杰,夏瑞. TBtools——大数据时代下的国产生物软件. 科学观察, 2022,17(06):33-35.

Chen, C., Chen, H., Zhang, Y., Thomas, H. R., Frank, M. H., He, Y., and Xia, R. (2020). TBtools: An Integrative Toolkit Developed for Interactive Analyses of Big Biological Data. Mol. Plant 13:1194–1202.

Chen C, Li J, Feng J, Liu B, Feng L, Yu X, Li G, Zhai J, Meyers BC, Xia R. sRNAanno-a database repository of uniformly annotated small RNAs in plants. Hortic Res. 2021 Mar 1;8(1):45

Chen Chengjie , Wu Ya ,  Li Jiawei, Wang Xiao , Zeng Zaohai , Xu Jing , Liu Yuanlong ,  Feng Junting, Chen Hao ,He Yehua , Xia Rui ,TBtools-II: A "One for All, All for One" Bioinformatics Platform for Biological Big-data Mining, Molecular Plant, 2023.

Gao F, Chen C, Arab DA, Du Z, He Y, Ho SYW. EasyCodeML: A visual tool for analysis of selection using CodeML. Ecol Evol. 2019 Mar 1;9(7):3891-3898.

Naish, M., Alonge, M., Wlodzimierz, P., Tock, A. J., Abramson, B. W., Schmücker, A., Mandáková, T., Jamge, B., Lambing, C., Kuo, P., et al. (2021). The genetic and epigenetic landscape of the Arabidopsis centromeres. Science 374.

Shang, L., He, W., Wang, T., Yang, Y., Xu, Q., Zhao, X., Yang, L., Zhang, H., Li, X., Lv, Y., et al. (2023). A complete assembly of the rice Nipponbare reference genome. Mol Plant Advance Access published August 2023, doi:10.1016/j.molp.2023.08.003.

Shi, X., Cao, S., Wang, X., Huang, S., Wang, Y., Liu, Z., Liu, W., Leng, X., Peng, Y., Wang, N., et al. (2023). The complete reference genome for grapevine (Vitis vinifera L.) genetics and breeding. Hortic Res 10.

Soyk, S., Lemmon, Z. H., Sedlazeck, F. J., Jiménez-Gómez, J. M., Alonge, M., Hutton, S. F., Van Eck, J., Schatz, M. C., and Lippman, Z. B. (2019). Duplication of a domestication locus neutralized a cryptic variant that caused a breeding barrier in tomato. Nat. Plants 5:471–479.

Sun, H., Jiao, W.-B., Krause, K., Campoy, J. A., Goel, M., Folz-Donahue, K., Kukat, C., Huettel, B., and Schneeberger, K. (2022). Chromosome-scale and haplotype-resolved genome assembly of a tetraploid potato cultivar. Nat Genet 54:342–348.

夏瑞,华南农业大学教授,博士生导师;2013年获得美国弗吉尼亚理工大学获得园艺学博士, 2019年获得广东省特支计划科技创新领军人才项目支持;2023年获得第六届“卫志明青年创新奖”。在Nature Genetics, Molecular Plant等学术刊物发表SCI论文60多篇,累计引用>10,000次,入选2022“中国高被引学者”(Elsevier)。目前主要利用生物信息学、基因组学及分子生物学等手段,围绕无患子科植物花性别分化机制以及岭南水果花果发育调控机理等生物学问题开展研究。

陈程杰,华南农业大学讲师,以基因组和生物信息学为主要研究手段,致力于香蕉枯萎病抗性机理解析。持续分享课题开展期间产生的新策略/新方法,形成生物软件并对外分发(含TBtools和GSAman)。在Molecular Plant和iMeta等学术刊物发表论文30余篇, 入选2022“中国高被引学者”。

猜你喜欢

iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索  Endnote

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

点击阅读原文,跳转最新文章目录阅读

这篇关于Mol Plant | 华南农大夏瑞团队发表TBtools-II,为个性化生物数据分析提供解决方案...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/271531

相关文章

数据库oracle用户密码过期查询及解决方案

《数据库oracle用户密码过期查询及解决方案》:本文主要介绍如何处理ORACLE数据库用户密码过期和修改密码期限的问题,包括创建用户、赋予权限、修改密码、解锁用户和设置密码期限,文中通过代码介绍... 目录前言一、创建用户、赋予权限、修改密码、解锁用户和设置期限二、查询用户密码期限和过期后的修改1.查询用

深入理解Redis大key的危害及解决方案

《深入理解Redis大key的危害及解决方案》本文主要介绍了深入理解Redis大key的危害及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、背景二、什么是大key三、大key评价标准四、大key 产生的原因与场景五、大key影响与危

Xshell远程连接失败以及解决方案

《Xshell远程连接失败以及解决方案》本文介绍了在Windows11家庭版和CentOS系统中解决Xshell无法连接远程服务器问题的步骤,在Windows11家庭版中,需要通过设置添加SSH功能并... 目录一.问题描述二.原因分析及解决办法2.1添加ssh功能2.2 在Windows中开启ssh服务2

Redis连接失败:客户端IP不在白名单中的问题分析与解决方案

《Redis连接失败:客户端IP不在白名单中的问题分析与解决方案》在现代分布式系统中,Redis作为一种高性能的内存数据库,被广泛应用于缓存、消息队列、会话存储等场景,然而,在实际使用过程中,我们可能... 目录一、问题背景二、错误分析1. 错误信息解读2. 根本原因三、解决方案1. 将客户端IP添加到Re

python 字典d[k]中key不存在的解决方案

《python字典d[k]中key不存在的解决方案》本文主要介绍了在Python中处理字典键不存在时获取默认值的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录defaultdict:处理找不到的键的一个选择特殊方法__missing__有时候为了方便起见,

Linux限制ip访问的解决方案

《Linux限制ip访问的解决方案》为了修复安全扫描中发现的漏洞,我们需要对某些服务设置访问限制,具体来说,就是要确保只有指定的内部IP地址能够访问这些服务,所以本文给大家介绍了Linux限制ip访问... 目录背景:解决方案:使用Firewalld防火墙规则验证方法深度了解防火墙逻辑应用场景与扩展背景:

SpringBoot嵌套事务详解及失效解决方案

《SpringBoot嵌套事务详解及失效解决方案》在复杂的业务场景中,嵌套事务可以帮助我们更加精细地控制数据的一致性,然而,在SpringBoot中,如果嵌套事务的配置不当,可能会导致事务不生效的问题... 目录什么是嵌套事务?嵌套事务失效的原因核心问题:嵌套事务的解决方案方案一:将嵌套事务方法提取到独立类

Spring Boot实现多数据源连接和切换的解决方案

《SpringBoot实现多数据源连接和切换的解决方案》文章介绍了在SpringBoot中实现多数据源连接和切换的几种方案,并详细描述了一个使用AbstractRoutingDataSource的实... 目录前言一、多数据源配置与切换方案二、实现步骤总结前言在 Spring Boot 中实现多数据源连接

MySQL的索引失效的原因实例及解决方案

《MySQL的索引失效的原因实例及解决方案》这篇文章主要讨论了MySQL索引失效的常见原因及其解决方案,它涵盖了数据类型不匹配、隐式转换、函数或表达式、范围查询、LIKE查询、OR条件、全表扫描、索引... 目录1. 数据类型不匹配2. 隐式转换3. 函数或表达式4. 范围查询之后的列5. like 查询6

使用Vue.js报错:ReferenceError: “Vue is not defined“ 的原因与解决方案

《使用Vue.js报错:ReferenceError:“Vueisnotdefined“的原因与解决方案》在前端开发中,ReferenceError:Vueisnotdefined是一个常见... 目录一、错误描述二、错误成因分析三、解决方案1. 检查 vue.js 的引入方式2. 验证 npm 安装3.