基因测序、生物信息分析平台工作站硬件配置推荐2020

本文主要是介绍基因测序、生物信息分析平台工作站硬件配置推荐2020，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

（一）了解生物信息学

生物信息学（Bioinformatics）利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据，其研究工具是计算机，研究方法包括对生物学数据的搜索（收集和筛选）、处理（编辑、整理、管理和显示）及利用（计算、模拟）。

生物信息学典型工作流程

这个过程是由一系列链接的步骤组成，这些步骤将原始输入（测序原始数据RAW）转换为有意义或可解释的输出，例如，高通量测序NGS数据而生成的fastq文件。然后用于基因组序列分析的特定功能方面的特定工具执行。根据执行的分析类型，工作流可以具有可变数量的步骤，因此可以是简单的或复杂的。

生物信息学主要研究方向：DNA/RNA/蛋白质测序，序列比对，基因发现，基因组组装，药物设计，药物发现，蛋白质结构比对和预测，通过使用计算密集型技术（用于模式识别，数据挖掘，机器学习算法和可视化）来加深对生物过程的理解。因此需要配备先进的计算设备和丰富专业的分析软件

（二）生物信息学分析的计算特点

如何选购一个理想的图形工作站硬件配置，可能很多人思考过：
什么是用于生物信息学和计算生物学研究的最佳PC/工作站？
用于生物信息学分析的服务器配置
全基因组序列分析实验室的硬件配置
高通量序列分析服务器有什么要求
下一代测序数据分析硬件配置推荐
用于分析NGS宏基因组学数据的计算机配置？

2.1 生物信息分析的计算特点

生物信息数据分析涉及到基因组学、转录组学、蛋白质组学、宏基因组学、代谢物组学等，下图是全基因组数据分析流程

生物信息学数据分析所涉及的计算主要是De novo的序列组装计算（Assembly）、重测序过程中的序列/映射比对计算（Mapping）

序列组装计算分析：
如果要进行从头组装（例如Velvet），假设一个人的全基因组测序数据，采用二代测序的方法，人的基因组3G，10倍数据30G，那么这30G的碱基，在切成更小的kmer，假设数据增加到了100G，还不算存储序列的一些其他信息，序列拼接的时候必须一次将所有数据同时存入内存，如果内存达不到100G，拼接根本无法完成。
因此，对于大型基因组装而言，需要的硬件资源特别多，不仅cpu要有足够的计算能力，内存在150G以上，但是如细菌基因组，数据集和基因组数据量不太大，内存128GB足够了

序列比对计算分析：
对于使用BWA/Bowtie等程序进行映射读取，对内存RAM要求不高（例如32GB即可），但CPU内核数量（及其频率）将决定计算过程需要多长时间。如果要进行大量对齐和比对（例如使用BWA），那么拥有大量CPU核心比拥有大量内存更为重要。
当然配置规格取决于您的预算和计划进行的分析类型。
RNASeq中计算量较大的就是比对步骤了，而比对往往只需要一次就可以！一般32核CPU+64GB RAM硬件配置，可以满足对基因组/转录组/虹基因组分析的标准映射（maping）以及下游分析。

为了使NGS（下一代测序）分析的工作负荷最大化，硬件配置三个关键瓶颈：可用的CPU核数、内存容量以及I/O带宽

2.2 生信分析对硬件配置要求

如何处理454和Illumina数据？全基因组装配/组装？序列拼接？映射读取到参考基因组？
（1）需要多少存储空间才能保持数据实时读取（硬盘容量）？
开发下一代测序（高通量测序）的临床应用的瓶颈是存储和分析所生成的大量数据。应用程序多种多样，但共同的主题在计算和分析上具有挑战性。
（2）要分析的每个文件有多大（RAM容量，硬盘读写速度）？
（3）要使用的软件准备好使用多处理器运行时间是否有要求（CPU核数）？

配置参考：
（1）基于基因组计划的大小

NO	基因组计划	配置参考
1	细菌（最高10MB）	32GB RAM，8个以上内核，10Gb磁盘空间
2	昆虫（高达500MB）	128GB RAM，16个以上内核，1Tb磁盘空间
3	禽类/小型植物基因组（最大1GB）	256GB RAM，32个以上内核，1TB磁盘空间
4	哺乳动物基因组（最大3GB）	512GBBb RAM，32个以上内核，3TB磁盘空间
5	植物基因组（高达30GB）	1TB RAM，64 +核，10Tb磁盘空间

（2）基于课题组研究人员数量

NO	课题组	配置参考
1	单人	16核+64G~256GB+ 8TB硬盘
2	1到5人课题组	64核+512GB内存+64TB硬盘
3	5人以上的课题组	100核以上+1TB内存+海量并行存储

（三）生物信息学分析的硬件配置推荐

NO	品牌与型号	配置规格	价格	备注
1	H380 150128-10TA	8核5.0GHz /128GB DDR4 /QuaroP620 /1.9TB SSD系统盘 +10TB SATA企业级/塔式(750w)/23寸-高清图显	35000
2	AX400 142256-12TA	18核4.2GHz / 256GB DDR4 /QuaroP620 /1.9TB SSD系统盘 +12TB SATA企业级/塔式(750w)/23寸-高清图显	58500
3	EX630i 226256-20TA	2颗Xeon 金5218R处理器（40核2.6GHz ）/ 256GB DDR4 /QuaroP620 /1.9TB SSD系统盘+20TB SATA企业级/塔式(865w)/23寸-高清图显	69990
4	EX630i 228384-20TA	2颗Xeon 金6230R处理器（52核2.8GHz ）/ 384GB DDR4 /QuaroP620 /3.84TB SSD系统盘+20TB SATA企业级/塔式(865w)/23寸-高清图显	98000
5	Alpha730i 427512-42TA	4颗Xeon 金5218处理器（72核2.7GHz ）/ 512GB DDR4 /QuaroP1000 /3.84TB SSD系统盘 +42TB并行存储/塔式(1400w冗余)/27"-4K图显	165000
6	Alpha730i 428512-70TA	4颗Xeon 金6230处理器（80核2.8GHz ）/ 512GB DDR4 /QuaroP1000 /1.92TB SSD系统盘 +1TB高速缓存/70TB并行存储/塔式(1400w冗余)/27"-4K图显	199990
7	Alpha730i 432768-84TB	4颗Xeon 金6248处理器（80核3.2GHz ）/ 768GB DDR4 /QuaroP1000 /1.92TB SSD系统盘 +2TB高速缓存/84TB并行存储/塔式(1400w冗余)/27"-4K图显	279000
8	Alpha730i 431768-84TB	4颗Xeon 白金8260处理器（96核3.1GHz ）/ 768GB DDR4 /QuaroP2000 /3.84TB SSD系统盘 +2TB高速缓存/98TB并行存储/塔式(1400w冗余)/27"-4K图显	330000
9	Alpha730i 4341T-112TB	4颗Xeon 白金8270处理器（104核3.4GHz ）/ 1TB DDR4 /QuaroP2000 /3.84TB SSD系统盘 +4TB高速缓存/112TB并行存储/塔式(1400w冗余)/27"-4K图显	428000
10	Alpha730i 4332T-112TB	4颗Xeon 白金8280处理器（112核3.3GHz ）/ 1.5TB DDR4 /QuaroP2000 /3.84TB SSD系统盘 +4TB高速缓存/112TB并行存储/塔式(1400w冗余)/27"-4K图显	585000