【生信笔记】Emsenbl的BioMart工具:对RNA进行多种ID批量转换

2023-10-12 13:30

本文主要是介绍【生信笔记】Emsenbl的BioMart工具:对RNA进行多种ID批量转换,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大家好我是lotusng,本期blog我跟大家分享一个RNA的ID转换方法:利用Emsenbl的BioMart工具。

众所周知(?),Emsenbl网站提供了多种物种的多种DNA与RNA的序列等信息,其实Emsenbl还有一个功能很强大的RNA 在线ID转换工具BioMart,我来安利一下~

Emsenbl的BioMart工具: http://asia.ensembl.org/biomart/martview/db73e9d48b0fb03717654a65c72012c4


文章目录

    • 0 数据输入格式与输出要求
    • 1 选择人类基因数据库
        • (1)-> Emsenbl
        • (2)-> 点BioMart
        • (3)-> 点Dataset
        • (4)-> 选择输入的基因来自什么库
    • 2 输入的ID列表
        • (1)-> 点Fliters(过滤器)
        • (2)-> 勾选Input ereferences ID list
        • (3)-> 选择输入的基因ID类别
        • (4) 文本框内输入Gene Name列表
    • 3 输出的属性选项
        • (1)-> Attributes(属性)
        • (2)-> GENE -> Ensembl 选择输出格式
        • (3)-> External References
    • 4 结果的输出及下载保存
        • (1)-> (网页左上角)点Results
        • (2)-> 下载格式选 XLS
        • (3)-> GO
    • 下面开始BioMart的技术总结
    • 附 Excel分列小技巧


0 数据输入格式与输出要求

 首先,看一下我们的例子,我们的数据是人类的miRNA的Gene name,目的是转换得到 Gene ID、Transcript ID、miRBase ID


1 选择人类基因数据库

(1)-> Emsenbl

  Emsenbl 网址:http://asia.ensembl.org/index.html

(2)-> 点BioMart
(3)-> 点Dataset
(4)-> 选择输入的基因来自什么库

 人类基因选择:选择 Ensembl Genes 92Human genes(GRCh38.p12) (注:目前最新的选项更新为Ensembl Genes 95,选它)

在这里插入图片描述


2 输入的ID列表

(1)-> 点Fliters(过滤器)
(2)-> 勾选Input ereferences ID list
(3)-> 选择输入的基因ID类别

  我们的数据是miRNA的Gene Name,如图选Gene Name(s)

(4) 文本框内输入Gene Name列表

在这里插入图片描述

  如果数据是Gene ID:ENSG12345678910这样的,选Gene stable ID(s)。以此类推。
  根据自己数据的类型,选择对应的ID格式。(注意看选项后括号里给出的例子,要和自己的数据完全对应上)
在这里插入图片描述

3 输出的属性选项

(1)-> Attributes(属性)
(2)-> GENE -> Ensembl 选择输出格式

  注意,所有要显示在结果里的输出格式都要选(包括我们输入的是Gene name格式,那么“Gene name”选择一样要选。否则,结果里不会显示输入的数据,只有一堆转换后的ID,无法输入输出一一对应)。
  所以,我们选择了Gene stable ID(输出)、Transcript stable ID(输出)、Gene name(输入)。
在这里插入图片描述

(3)-> External References

  同样还在Attributes下GENE里的子选项,下拉。在External References 中,其它的输出格式按需求选择。我们选择了miRBase ID(输出)。此处最多能选择3项。
在这里插入图片描述

4 结果的输出及下载保存

(1)-> (网页左上角)点Results

  得到结果,包括了我们的输入列Gene name,输出列 Gene stable ID、Transcript stable ID和miRBase ID。

(2)-> 下载格式选 XLS
(3)-> GO

  然后就可以下载到这个表格的xls版本啦。
在这里插入图片描述

下面开始BioMart的技术总结

  1. 流程就是以上这么个流程,步骤做一遍就清晰了。
  2. 关键是输入格式要选对,注意BioMart所给的ID例子,一定要完全对应,否则无法识别。
  3. 输出选项里,注意要把输入格式也选上,否则输入选项并不会显示在结果里。
  4. 例子里一共选了4个属性选项,所以得到4个输出列。合理运用BioMart,按需选择输入格式和输出格式,就能对多种RNA做多种ID转换了。

附 Excel分列小技巧

之前同学的同学问我怎么把带版本号的mRNA的Gene ID转换成mRNA的Gene name。
一开始他是在NCBI一个一个查,我觉得吧,可以是可以,没必要是真的没必要,这时BioMart就很好用啦。

他的原数据是这样的(第一列):


由于他的原始数据中mRNA Gene ID 是带小数的,而这个小数并不影响转换得到对应Gene name,直接把放入BioMart作为Gene stable ID又无法被识别。可以选择用excel的分列功能,批量将小数删去。(当然还有很多种删掉小数的方法,这里只是示范一种简单的方法,来让我们的数据和BioMart的要求对应上。)

操作如下:
用Excel打开数据 -> 全选我们的数据 -> 工具栏[数据] -> [分列] -> 选[分隔符号] -> [下一步]
在这里插入图片描述


-> 选[其它] -> 输入“.” -> [下一步] -> [完成]


结果如下图。



欢迎留言讨论与交流~

lotusng:
major in CS
foucs on 生信数据挖掘与算法设计

这篇关于【生信笔记】Emsenbl的BioMart工具:对RNA进行多种ID批量转换的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/196172

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

Java数字转换工具类NumberUtil的使用

《Java数字转换工具类NumberUtil的使用》NumberUtil是一个功能强大的Java工具类,用于处理数字的各种操作,包括数值运算、格式化、随机数生成和数值判断,下面就来介绍一下Number... 目录一、NumberUtil类概述二、主要功能介绍1. 数值运算2. 格式化3. 数值判断4. 随机

Python利用PIL进行图片压缩

《Python利用PIL进行图片压缩》有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所以本文为大家介绍了Python中图片压缩的方法,需要的可以参考下... 有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所有可以对文件中的图

使用Navicat工具比对两个数据库所有表结构的差异案例详解

《使用Navicat工具比对两个数据库所有表结构的差异案例详解》:本文主要介绍如何使用Navicat工具对比两个数据库test_old和test_new,并生成相应的DDLSQL语句,以便将te... 目录概要案例一、如图两个数据库test_old和test_new进行比较:二、开始比较总结概要公司存在多

如何使用Spring boot的@Transactional进行事务管理

《如何使用Springboot的@Transactional进行事务管理》这篇文章介绍了SpringBoot中使用@Transactional注解进行声明式事务管理的详细信息,包括基本用法、核心配置... 目录一、前置条件二、基本用法1. 在方法上添加注解2. 在类上添加注解三、核心配置参数1. 传播行为(

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型