MaxQuant的安装和使用(linux OR windows)

2024-01-28 04:20

本文主要是介绍MaxQuant的安装和使用(linux OR windows),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 1. 安装
  • 2. 用法
    • 2.1 命令行方式(linux)
    • 2.2 GUI方式(windows)
      • Andromeda配置/Configuration(2)
      • 数据上传/Raw files (14)
      • 组特异参数/Group-specific parameters(17)
      • 全局参数/Global parameters (36)
      • Performance(82)
      • ==处理器数量(80)==
  • 3. Troubleshooting
  • 参考

MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。

1. 安装

MaxQuant下载方式:

  • 通过官网 下载,包括andromeda(搜索引擎)+viewer(检查原始数据、鉴定和定量结果)。
  • 通过conda下载,详见下面代码。(linux安装时推荐使用该方法)
conda create -n maxquant
conda activate maxquant
conda install -c bioconda maxquantmaxquant --help    # 查看命令行参数#maxquant mqpar.xml#报错如下:.NET Core 3.1 needs to be installed. Please visit https://dotnet.microsoft.com/download/dotnet-core/3.1 and install the SDK x64.#mkdir -p dotnet; cd dotnet#wget ...#tar xzvf dotnet-sdk-3.1.426-linux-x64.tar.gz#export DOTNET_ROOT=/path/software/dotnet#export PATH=$PATH:/path/software/dotnet

此外,官网还提供了Perseus软件,用于对MaxQuant输出进行统计分析。

2. 用法

2.1 命令行方式(linux)

通过以下任一方法生成配置文件。其中方法1需要人工修改较多地方,方法2仅需修改文件位置,更加方便,但需要注意使用相同版本GUI来产生配置文件。

# 方法1. 生成配置文件mqpar.xml
maxquant --create mqpar.xml
#maxquant mqpar.xml --changeFolder=mqpar_new.xml /fasta /raw
vi mqpar.xml# 方法2. 相同版本GUI保存参数文件,传输到linux

基于配置文件运行软件。

maxquant mqpar.xml

2.2 GUI方式(windows)

双击MaxQuant.exe,打开以下界面。红框为参数配置模块。其中大部分参数通常并不需要改变,一般使用官方protocol中提供的minimal workflow就可以,见下文高亮部分。 另外,官方protocol中一些参数随着版本更新其位置已经发生改变或者被移除,此类参数会以删除线标识。
在这里插入图片描述

Andromeda配置/Configuration(2)

  • Modifications(3-10):修饰的增、改。
  • Proteases(11)
  • Sequence databases(12-13)v2.0.3.0中没有发现该参数。

数据上传/Raw files (14)

  • Load data(15):通过以下任一方法导入原始数据,如.raw等。
    • Load:导入原始数据。
    • Load folder: 导入选中文件夹中所有原始数据。
  • Experimental design(16):通过以下任一方法设置元数据。
    • Set*:选中行后,①通过Set experiment设置实验(分组/样本),相同实验的数据后续会被合并;②通过Set paramter group设置参数组,不同参数组可以应用不同的参数设置,具体设置见(17);③通过Set fraction设置fraction;
    • Write*:当数据项较多时,可以通过Write template导出包含数据的模板文件,然后在直接编辑模板文件,最后将编辑好的模板文件通过Read from file导入软件。
      在这里插入图片描述

组特异参数/Group-specific parameters(17)

  • Type(19)
    • Type(19):指定LC-MS run的类型。①label-free和MS1-labeled样本选择Standard;②传统的同位素标记标记样本选择Reporter ion MS2;③同位素标记的MS3质谱选择Reporter ion MS3
    • Multiplicity(19):指定MS1标签数。如果没有使用标签,设置为1。下方复选框选择使用的标签。
      在这里插入图片描述
  • Digestion(20)
    • Digestion mode(21):
    • Enzyme(22):因为准确的裂解特异性等优点,胰蛋白酶在多数自下而上的蛋白质组学实验中都被用作蛋白酶。因此Enzyme默认值为Trypsin/P。胰蛋白酶能裂解精氨酸和赖氨酸C末端的肽段,除非其后有脯氨酸。MaxQuant使用该规则对蛋白质数据库进行in silico裂解。
    • Max. missed cleavages(23):蛋白酶消化并不总是完全的,通过将参数设为2,in silico裂解的序列中也包括含有额外精氨酸或赖氨酸的肽段。
      在这里插入图片描述
  • Modifications(24):根据in silico生成的多肽数据库计算出多肽的质量,并与测量的质量相匹配,从而对其进行识别。肽的质量会因肽的修饰而改变,例如在不同定量策略中应用的化学标记或生物学翻译后修饰。因此,在in silico生成的肽质量列表中还必须包括可能的肽修饰。
    • Variable modifications(25)Variable modifications是指并非每个氨基酸都会发生的修饰,如蛋氨酸氧化(Oxidation (M))可能只发生在某些蛋氨酸上。再比如,只有少数肽的 N 端会发生乙酰化(Acetyl (Prorein N-term))。需要注意的是可变修饰会增加in silico肽数据库的容量,进而增加分析时间。
    • Fixed modifications(39)Fixed modifications是指特定氨基酸每次出现时都会发生的修饰。这些修饰通常是人为引入的,如蛋白质组学样品制备中防止二硫键重新形成的半胱氨酸的氨基甲酰甲基化,也是该参数的默认值Carbamidomethyl (C)
    • Max. number of modifications allowed per peptide(26);
      在这里插入图片描述
  • Label-free quantification(27):
    • Label-free quantification(27):选择是否应用LFQ算法。
      • min. ratio count(28)
      • Fast LFQ(29)
      • Skip normalization(30)
        在这里插入图片描述
  • Instrument (31)
  • First search: (32)
  • Misc.(33): Re-quantify(34); Match type(35)???

全局参数/Global parameters (36)

  • Sequences(37)
    在这里插入图片描述

    • Add(37):添加数据库。此外,还可以通过IdentifierDescription定义的正则,从fasta头提取ID和描述。
    • Include contaminants(38): 将conf/contaminants.fasta中的蛋白添加到搜索数据库。
    • Fixed modifications(39):v2.0.3.0中该参数已移动至页面(24)下,详见上文。
    • Min. peptide length & Max. peptide mass(40):设置用于蛋白鉴定和定量肽段的最短长度(典型值7-9,长度<7的肽段不是唯一的。注:甚至更长的肽段也不是唯一的,比如源于同一结构域的肽段可能被同源蛋白共有,可以通过设置min unique peptides处理该情况)和最大质量。
    • (Min|Max). peptide lengths for unspecific(41):设置非特异性搜索(即不使用消化酶)情况下的最小和最大肽段长度;
  • Identification(42)
    在这里插入图片描述
    红框中的13个参数在v2.0.3.0和v1.5.3.30中都在Identification下。

    • PSM FDR(43):PSM水平的FDR阈值,由TDA计算得出,0.01代表1% FDR。
    • Protein FDR(44):蛋白质水平的FDR阈值。
    • Site decoy fraction(45):修饰位点表水平上对饵命中进行过滤。
    • Min. peptides(46):鉴定一个蛋白质簇所需总肽段数的最小值,并在最终表格中报告。
    • Min. razor + unique peptides(46):鉴定一个蛋白质簇所需razor+unique肽段数的最小值,并在最终表格中报告。
    • Min. unique peptides(46):鉴定一个蛋白质簇所需unique肽段数的最小值,并在最终表格中报告。肽会以统计的方式组合成相应的蛋白质,因此主要应根据唯一肽进行判断。可以将参数设为1,即输出表中只报告至少有一个唯一肽的蛋白质。
    • Min. score for unmodified peptides(47):接受MS2鉴定无修饰肽的最小Andromeda分数。推荐值为0,即除FDR外,没有额外的过滤。
    • Min. score for modified peptides(47):接受MS2鉴定修饰肽的最小Andromeda分数。默认值为40。除对PSMs应用的FDR外,还需额外过滤。
    • Min. delta score for unmodified peptides(47):接受MS2鉴定无修饰肽的最小Andromeda delta分数推荐值为0,即除FDR外,没有额外的过滤。
    • Min. score for modified peptides(47):接受MS2鉴定修饰肽的最小Andromeda delta分数默认值为6。除对PSMs应用的FDR外,还需额外过滤。
    • Base FDR calculations on delta score:如果选中,所有 FDR 计算都将使用 delta 分数作为输入。delta 分数是得分最高的 PSM 与氨基酸序列不同、得分次之的 PSM 之间的分数差。
    • Dependent peptides:无偏搜索来自已鉴定肽的修饰肽。
  • Adv. Identification???(51)

  • Protein quantification(55)
    在这里插入图片描述

    • (Label)? Min. ratio count:设置蛋白定量的最小比值计数。对于定量标记肽对/三联体数量较少的蛋白质,将不报告比值。如果使用实验设计,则该标准将分别应用于每个实验。
    • Peptides for quantification:指定蛋白质比率的计算方式。All 选项将使用所有肽段进行定量。Unique 选项则只使用簇中特有肽进行定量。Unique + razor 选项通过簇中特有肽和剃刀肽计算蛋白质比率。剃刀肽(razor)是指分配给蛋白簇的非特有肽,该蛋白质簇中有最多的其他肽。
    • Use only unmodified peptides and …:指定蛋白质定量应使用哪种多肽。如果未选中,则使用所有肽段(无论其修饰状态)。如果选中,则使用所有未修饰肽段+仅在下面字段中指定修饰的肽段。
      • Modifications used in protein quantification:
      • Discard unmodified counterpart peptide:如选中,则未修饰的多肽也将被丢弃,因为鉴定的修饰多肽对应的修饰未在上述字段中指定。
    • Adavanced ratio estimation:
  • Tables(66)

  • Folder locations(67)

  • Advanced(72)
    在这里插入图片描述

    • Used for occupancies:在计算基于标签的occupancies,使用归一化还是非归一化比率。
  • Number of threads(80)

  • Start(81)

Performance(82)

处理器数量(80)

3. Troubleshooting

https://groups.google.com/g/maxquant-list

参考

Neuhauser, Nadin, et al. “High performance computational analysis of large-scale proteome data sets to assess incremental contribution to coverage of the human genome.” Journal of proteome research 12.6 (2013): 2858-2868.
2013年,作者发布了支持并行计算的版本(1.3.7.4)。

MaxQuant goes Linux
2018年,作者发布了MaxQuant的linux版本(1.6.1.0)。该版本主要依赖mono

MaxQuant Doc
官方文档链接。

【6】蛋白质组学鉴定定量软件之MaxQuant
一篇MaxQuant的中文实践。

Label-free data analysis using MaxQuant
文章介绍了如何Galaxy平台中使用MaxQuant,本文翻译了其中对参数的解释。

这篇关于MaxQuant的安装和使用(linux OR windows)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/652458

相关文章

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块