Linux入门真经-038RAID磁盘阵列

2024-03-04 17:48

本文主要是介绍Linux入门真经-038RAID磁盘阵列,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

前一节讲的LVM为分区的空间提供了弹性扩展的可能,LVM快照则对软件/逻辑层面的数据恢复提供了可能。然而,这还远远不够。如果仅仅如此,磁盘坏了,基本就意味着数据丢失,因此,我们需要一些措施,从物理层面上提供一定程度的数据冗余,提高数据的安全性。

为此,RAID技术应运而生。而且RAID不仅为数据安全性提高保障(比如某些RAID级别可以保证一块或多块硬盘坏了数据不丢失、业务不中断),还在容量、读写效率方面提供了助力。接下来就给大家介绍RAID技术。

 

1、RAID简介

 

RAID全名是Redundant Arraysof Inexpensive Disks(廉价磁盘冗余阵列),当然,廉价不廉价这个问题其实是不太好说的。他可以通过软件或者硬件的手段,把几个硬盘整合成一个较大的硬盘。于此同时,RAID还提供了不同的级别来实现更加丰富的功能。

软RAID比较少见,centos内置了mdadm命令去实现软RAID。但是软RAID无法对系统盘所在的分区数据进行保障,而且通过其实现的RAID通常性能也比较差,本文不作介绍。

 

我们生产中更常见到的是硬RAID,在物理服务器上配置硬件RAID卡来实现。硬RAID通常配备了读写缓存,对存储IO的性能有了大幅的改善。不同服务器由于配置的RAID卡型号不同,配置方法、支持的RAID级别、读写控制功能都有所不同。但是RAID级别的原理和特性是相同的,服务器厂商通常都会为购买者配备详尽的配置手册,而且配置通常非常简单。因此对于配置我们无需多虑,但是我们需要了解RAID各个级别及相关原理特性。本文会介绍RAID0、RAID1、RAID5、RAID10、RAID50

注:RAID通常由多块硬盘组成,建议同一个RAID组内的硬盘型号相同,否则会在各个参数上存在短板效应(转速、容量、性能按最低的那块硬盘算)。

 

2、RAID0

 

RAID0可以由一块或多块硬盘组成。

RAID会将磁盘先切出等量的区块(如4K),然后当一个文件要写进RAID的时候,文件会根据区块的大小进行切割,再依次存到各个磁盘里面去,以两块硬盘为例,一个文件被切割成A1,A2…A8,存储情况如下图:

 

 

我们可以看出,一份文件数据会被分散保存在多块硬盘上。我们在物理机上有两块盘,组成RAID0之后,我们在系统里看到的是一块,容量为组成RAID0的硬盘容量之和。由于数据被分散存储在多个硬盘,任何一个硬盘的损坏都会导致整个RAID组的数据丢失。

但是存取数据时,由于从单个硬盘通道变为多个硬盘通道,因此读写性能会有较大的提升。

总结一下RAID0的特性:

 

读、写性能提升;

可用空间:硬盘数*最小硬盘容量

无容错能力(一块硬盘损坏数据全部丢失)

所需磁盘数:1个及以上

 

 

3、RAID1

 

两块硬盘,存储一模一样的数据,互为镜像,一块硬盘坏了,另一块硬盘自动顶上,数据不会丢失,是否会导致业务的中断具体要看RAID卡的功能和厂商的相关承诺。

假设一个文件被切割成A1,A2,A3,A4,RAID1的数据存储原理如下:

 

 

可以看到,两块硬盘存的数据一模一样,任何一块坏了都不会丢失数据。但这也导致了可用容量只有原来的一半。写数据的时候由于需要写2份,所以写速度会略有降低。但是读取数据时两边都可以读,因此读性能会有所提升。

RAID1小结:

读性能提升,写性能略有下降

可用空间:二分之一

冗余性:两块盘可坏一块

所需磁盘数:2

 

4、RAID5

 

RAID0可以获得大容量硬盘,但是可靠性十分脆弱。RAID1可靠性非常好,但是硬盘容量相对比较小,有没有折中方案呢?有的,最常见的就是RAID5。

讲RAID5之前先讲点数学。

我们小时候都学过方程。不如,2*a=1,我们可以算出a=0.5,这里有一个等式,一个未知数,我们可以算出未知数的值。

计算机精通于零一计算,也有很多数学哲理在里面。

比如异或:两数相等异或为0,两数不同异或为1

比如说:

0异或0异或1异或1=0

现在假设有一个数字不知道:

0异或x异或1异或1=0

我们可以得到

x=0异或0异或1异或1=0

你会发现,无论多少个0、1进行异或运算,遮住一个数,都能通过这种方法把这个数字计算出来。

而RAID5就是采用的类似于这样的方法。根据其他磁盘的存储信息,生成奇偶校验信息并且存储起来,当一块盘损坏之后,可以根据奇偶校验信息把那块盘的数据计算出来。

存储原理如下图,校验信息分散存储与各个硬盘之中:

因此,RAID5允许损坏一块盘,且可以将多块硬盘组合成大硬盘(总的来说,会损失一块盘的容量存放校验信息)。硬盘的读写性能是有提升的(同一RAID组内的硬盘越多,提升越明显)

 

RAID5小结:

各个盘轮流存放校验码

读、写性能提升

可用空间:(N-1)*最小磁盘空间

有容错能力:可以坏1块磁盘

所需磁盘数:3及以上

 

5、RAID10

 

又称RAID1+0。先做RAID1,再组合成RAID0

RAID10小结:

 

读、写性能提升

可用空间:最小硬盘容量*硬盘数/2

有容错能力:每组镜像最多只能坏一块;如上图,disk0和disk1可以任意坏一块,disk2和disk3可以任意坏一块。

最少磁盘数:4个以上且为偶数个。

 

6、RAID50

 

类比RAID10。先多个一组做成RAID5,再将多个RAID5制成RAID0

RAID50小结:

读、写性能提升

可用空间:最小硬盘容量*(硬盘数-RAID5组数)

有容错能力:每组RAID5都可以坏一块盘;

最少磁盘数:6个以上

 

 

最后给一些整体性的补充:

硬盘坏了服务器通常会有指示灯显示,赶紧换同型号硬盘,免得拖久了同一RAID组内再次坏盘,数据无价。

 

一般如果RAID卡和硬盘主板支持热插拔的话,遇到坏盘直接更换即可,RAID卡会自动同步数据(以硬件厂家的说明为准)

 

关注本公众号获取最新更新

每周一、三、五稳定更新

这篇关于Linux入门真经-038RAID磁盘阵列的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773960

相关文章

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

Linux环境变量&&进程地址空间详解

《Linux环境变量&&进程地址空间详解》本文介绍了Linux环境变量、命令行参数、进程地址空间以及Linux内核进程调度队列的相关知识,环境变量是系统运行环境的参数,命令行参数用于传递给程序的参数,... 目录一、初步认识环境变量1.1常见的环境变量1.2环境变量的基本概念二、命令行参数2.1通过命令编程

Linux之进程状态&&进程优先级详解

《Linux之进程状态&&进程优先级详解》文章介绍了操作系统中进程的状态,包括运行状态、阻塞状态和挂起状态,并详细解释了Linux下进程的具体状态及其管理,此外,文章还讨论了进程的优先级、查看和修改进... 目录一、操作系统的进程状态1.1运行状态1.2阻塞状态1.3挂起二、linux下具体的状态三、进程的

Linux编译器--gcc/g++使用方式

《Linux编译器--gcc/g++使用方式》文章主要介绍了C/C++程序的编译过程,包括预编译、编译、汇编和链接四个阶段,并详细解释了每个阶段的作用和具体操作,同时,还介绍了调试和发布版本的概念... 目录一、预编译指令1.1预处理功能1.2指令1.3问题扩展二、编译(生成汇编)三、汇编(生成二进制机器语

Rsnapshot怎么用? 基于Rsync的强大Linux备份工具使用指南

《Rsnapshot怎么用?基于Rsync的强大Linux备份工具使用指南》Rsnapshot不仅可以备份本地文件,还能通过SSH备份远程文件,接下来详细介绍如何安装、配置和使用Rsnaps... Rsnapshot 是一款开源的文件系统快照工具。它结合了 Rsync 和 SSH 的能力,可以帮助你在 li

Linux部署jar包过程

《Linux部署jar包过程》文章介绍了在Linux系统上部署Java(jar)包时需要注意的几个关键点,包括统一JDK版本、添加打包插件、修改数据库密码以及正确执行jar包的方法... 目录linux部署jar包1.统一jdk版本2.打包插件依赖3.修改密码4.执行jar包总结Linux部署jar包部署

mysqld_multi在Linux服务器上运行多个MySQL实例

《mysqld_multi在Linux服务器上运行多个MySQL实例》在Linux系统上使用mysqld_multi来启动和管理多个MySQL实例是一种常见的做法,这种方式允许你在同一台机器上运行多个... 目录1. 安装mysql2. 配置文件示例配置文件3. 创建数据目录4. 启动和管理实例启动所有实例

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)