生物信息之多序列比对,进化树分析,保守位点分析

2024-06-02 23:18

本文主要是介绍生物信息之多序列比对,进化树分析,保守位点分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、序列下载与整理
      • 下载fasta格式序列
      • 合并多个fasta文件
  • 二、多序列比对
      • 软件下载安装
      • 序列比对
  • 三、进化树分析
  • 四、保守位点分析

一、序列下载与整理


下载fasta格式序列

0、输入网址:https://www.ncbi.nlm.nih.gov/gene

1、输入你想查找的序列,比如Syp基因 可以点击图片来查看高清图

这里写图片描述

2、进入基因详细信息页面
这里写图片描述

3、点击Genbank
这里写图片描述

4、如图所示可以下载到fasta格式的序列,注意这里下载的是基因或者蛋白质的全序列

如果你有一定的Python编程基础,可以查看这篇文章来批量下载大量基因序列:生物信息中的Python 04 | 批量下载基因与文献

这里写图片描述

当然,你也可以直接用CDS,各种基因元件来做进化树。

如果你有编程基础,可以参考这篇从 Genbank 文件中提取 CDS 等其他特征序列 来提取基因特征序列。

这里提供一种提取基因启动子区域的方法

  • 假如你希望得到promoter的基因,可以在如图所示的位置输入起始位点和终止位点
  • 一般promoter的位点不确定,可以通过将起始位点左右2kb基因视为promoter
  • 比如:如图起始位点为7638580,那么起始位点要减500,终止位点加1499,这时需要在from输入7638080,to输入7640079(得到长度为2kb的序列)
  • 点击Update view 按钮
  • 然后和同上一步下载fasta序列
    这里写图片描述

合并多个fasta文件

1、下载多个序列后,我们将下载的序列整理到特定文件夹下,比如D:\Download\fasta_files,就像这样:
mark

2、你的fasta_files文件夹里应该是这样的
这里写图片描述

3、返回D:\Download路径下,在文件夹空白地方Shift+右键,点击在此处打开命令窗口
这里写图片描述

4、输入
type fasta_files\*.fasta > all_sequence.fasta
mark

5、现在,在你的文件夹下应该类似这样的:
mark

6、得到整合文件 all_sequence.fasta(这个文件也可以通过记事本打开,下面软件为UE)
这里写图片描述

二、多序列比对


软件下载安装

Clustalw 下载链接:http://www.clustal.org/download/current/clustalw-2.1-win.msi

Clustalx 下载链接:http://www.clustal.org/download/current/clustalx-2.1-win.msi

MEGA 下载链接:http://www.megasoftware.net/releases/MEGA7.0.26_win64_setup.exe

序列比对

1、打开MEGA,进入序列比对分析
这里写图片描述

2、载入fasta序列
这里写图片描述

3、使用Clustalw 比对序列,参数默认点OK
这里写图片描述

4、跑出来的结果需要编辑第一列只留下物种名,序列去掉5’,3’端的空序列(因为要比对序列同源性,最好把显示 - 的序列去掉,使多序列的两端整齐,类似矩阵)
mark

5、导出fasta格式和MEGA格式两种格式
这里写图片描述

6、打开Clustalx 加载刚刚比对完的fasta格式(注意是比对完的,文件后缀名为.fas)
这里写图片描述

7、导出可视化文件,参数默认点OK
这里写图片描述

8、得到可视化的多序列比对结果,打开类似这样(打开用到的软件为Adobe Acrobat)
这里写图片描述

三、进化树分析


1、打开MEGA,载入meg文件
这里写图片描述

2、参数设置(这里是核酸序列)
这里写图片描述

3、得到进化树
这里写图片描述

这里写图片描述

4、导出与美化
这里写图片描述

美化参考:http://www.sohu.com/a/130616941_278730

四、保守位点分析


1、输入网址

MEME : http://meme-suite.org/tools/meme

2、上传fasta序列(这里的序列是整合后的文件,文件后缀.fasta),并输入参数(这里设置motif为10)
这里写图片描述

3、得到保守位点分析结果
这里写图片描述

这篇关于生物信息之多序列比对,进化树分析,保守位点分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025367

相关文章

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

关于最长递增子序列问题概述

《关于最长递增子序列问题概述》本文详细介绍了最长递增子序列问题的定义及两种优化解法:贪心+二分查找和动态规划+状态压缩,贪心+二分查找时间复杂度为O(nlogn),通过维护一个有序的“尾巴”数组来高效... 一、最长递增子序列问题概述1. 问题定义给定一个整数序列,例如 nums = [10, 9, 2

C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep

C#实现系统信息监控与获取功能

《C#实现系统信息监控与获取功能》在C#开发的众多应用场景中,获取系统信息以及监控用户操作有着广泛的用途,比如在系统性能优化工具中,需要实时读取CPU、GPU资源信息,本文将详细介绍如何使用C#来实现... 目录前言一、C# 监控键盘1. 原理与实现思路2. 代码实现二、读取 CPU、GPU 资源信息1.

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

C#实现获取电脑中的端口号和硬件信息

《C#实现获取电脑中的端口号和硬件信息》这篇文章主要为大家详细介绍了C#实现获取电脑中的端口号和硬件信息的相关方法,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 我们经常在使用一个串口软件的时候,发现软件中的端口号并不是普通的COM1,而是带有硬件信息的。那么如果我们使用C#编写软件时候,如

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制