Linux入门真经-038RAID磁盘阵列

2024-03-04 17:48

本文主要是介绍Linux入门真经-038RAID磁盘阵列,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

前一节讲的LVM为分区的空间提供了弹性扩展的可能,LVM快照则对软件/逻辑层面的数据恢复提供了可能。然而,这还远远不够。如果仅仅如此,磁盘坏了,基本就意味着数据丢失,因此,我们需要一些措施,从物理层面上提供一定程度的数据冗余,提高数据的安全性。

为此,RAID技术应运而生。而且RAID不仅为数据安全性提高保障(比如某些RAID级别可以保证一块或多块硬盘坏了数据不丢失、业务不中断),还在容量、读写效率方面提供了助力。接下来就给大家介绍RAID技术。

 

1、RAID简介

 

RAID全名是Redundant Arraysof Inexpensive Disks(廉价磁盘冗余阵列),当然,廉价不廉价这个问题其实是不太好说的。他可以通过软件或者硬件的手段,把几个硬盘整合成一个较大的硬盘。于此同时,RAID还提供了不同的级别来实现更加丰富的功能。

软RAID比较少见,centos内置了mdadm命令去实现软RAID。但是软RAID无法对系统盘所在的分区数据进行保障,而且通过其实现的RAID通常性能也比较差,本文不作介绍。

 

我们生产中更常见到的是硬RAID,在物理服务器上配置硬件RAID卡来实现。硬RAID通常配备了读写缓存,对存储IO的性能有了大幅的改善。不同服务器由于配置的RAID卡型号不同,配置方法、支持的RAID级别、读写控制功能都有所不同。但是RAID级别的原理和特性是相同的,服务器厂商通常都会为购买者配备详尽的配置手册,而且配置通常非常简单。因此对于配置我们无需多虑,但是我们需要了解RAID各个级别及相关原理特性。本文会介绍RAID0、RAID1、RAID5、RAID10、RAID50

注:RAID通常由多块硬盘组成,建议同一个RAID组内的硬盘型号相同,否则会在各个参数上存在短板效应(转速、容量、性能按最低的那块硬盘算)。

 

2、RAID0

 

RAID0可以由一块或多块硬盘组成。

RAID会将磁盘先切出等量的区块(如4K),然后当一个文件要写进RAID的时候,文件会根据区块的大小进行切割,再依次存到各个磁盘里面去,以两块硬盘为例,一个文件被切割成A1,A2…A8,存储情况如下图:

 

 

我们可以看出,一份文件数据会被分散保存在多块硬盘上。我们在物理机上有两块盘,组成RAID0之后,我们在系统里看到的是一块,容量为组成RAID0的硬盘容量之和。由于数据被分散存储在多个硬盘,任何一个硬盘的损坏都会导致整个RAID组的数据丢失。

但是存取数据时,由于从单个硬盘通道变为多个硬盘通道,因此读写性能会有较大的提升。

总结一下RAID0的特性:

 

读、写性能提升;

可用空间:硬盘数*最小硬盘容量

无容错能力(一块硬盘损坏数据全部丢失)

所需磁盘数:1个及以上

 

 

3、RAID1

 

两块硬盘,存储一模一样的数据,互为镜像,一块硬盘坏了,另一块硬盘自动顶上,数据不会丢失,是否会导致业务的中断具体要看RAID卡的功能和厂商的相关承诺。

假设一个文件被切割成A1,A2,A3,A4,RAID1的数据存储原理如下:

 

 

可以看到,两块硬盘存的数据一模一样,任何一块坏了都不会丢失数据。但这也导致了可用容量只有原来的一半。写数据的时候由于需要写2份,所以写速度会略有降低。但是读取数据时两边都可以读,因此读性能会有所提升。

RAID1小结:

读性能提升,写性能略有下降

可用空间:二分之一

冗余性:两块盘可坏一块

所需磁盘数:2

 

4、RAID5

 

RAID0可以获得大容量硬盘,但是可靠性十分脆弱。RAID1可靠性非常好,但是硬盘容量相对比较小,有没有折中方案呢?有的,最常见的就是RAID5。

讲RAID5之前先讲点数学。

我们小时候都学过方程。不如,2*a=1,我们可以算出a=0.5,这里有一个等式,一个未知数,我们可以算出未知数的值。

计算机精通于零一计算,也有很多数学哲理在里面。

比如异或:两数相等异或为0,两数不同异或为1

比如说:

0异或0异或1异或1=0

现在假设有一个数字不知道:

0异或x异或1异或1=0

我们可以得到

x=0异或0异或1异或1=0

你会发现,无论多少个0、1进行异或运算,遮住一个数,都能通过这种方法把这个数字计算出来。

而RAID5就是采用的类似于这样的方法。根据其他磁盘的存储信息,生成奇偶校验信息并且存储起来,当一块盘损坏之后,可以根据奇偶校验信息把那块盘的数据计算出来。

存储原理如下图,校验信息分散存储与各个硬盘之中:

因此,RAID5允许损坏一块盘,且可以将多块硬盘组合成大硬盘(总的来说,会损失一块盘的容量存放校验信息)。硬盘的读写性能是有提升的(同一RAID组内的硬盘越多,提升越明显)

 

RAID5小结:

各个盘轮流存放校验码

读、写性能提升

可用空间:(N-1)*最小磁盘空间

有容错能力:可以坏1块磁盘

所需磁盘数:3及以上

 

5、RAID10

 

又称RAID1+0。先做RAID1,再组合成RAID0

RAID10小结:

 

读、写性能提升

可用空间:最小硬盘容量*硬盘数/2

有容错能力:每组镜像最多只能坏一块;如上图,disk0和disk1可以任意坏一块,disk2和disk3可以任意坏一块。

最少磁盘数:4个以上且为偶数个。

 

6、RAID50

 

类比RAID10。先多个一组做成RAID5,再将多个RAID5制成RAID0

RAID50小结:

读、写性能提升

可用空间:最小硬盘容量*(硬盘数-RAID5组数)

有容错能力:每组RAID5都可以坏一块盘;

最少磁盘数:6个以上

 

 

最后给一些整体性的补充:

硬盘坏了服务器通常会有指示灯显示,赶紧换同型号硬盘,免得拖久了同一RAID组内再次坏盘,数据无价。

 

一般如果RAID卡和硬盘主板支持热插拔的话,遇到坏盘直接更换即可,RAID卡会自动同步数据(以硬件厂家的说明为准)

 

关注本公众号获取最新更新

每周一、三、五稳定更新

这篇关于Linux入门真经-038RAID磁盘阵列的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773960

相关文章

从入门到精通MySQL联合查询

《从入门到精通MySQL联合查询》:本文主要介绍从入门到精通MySQL联合查询,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下... 目录摘要1. 多表联合查询时mysql内部原理2. 内连接3. 外连接4. 自连接5. 子查询6. 合并查询7. 插入查询结果摘要前面我们学习了数据库设计时要满

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

从入门到精通C++11 <chrono> 库特性

《从入门到精通C++11<chrono>库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段(Durat

Linux中SSH服务配置的全面指南

《Linux中SSH服务配置的全面指南》作为网络安全工程师,SSH(SecureShell)服务的安全配置是我们日常工作中不可忽视的重要环节,本文将从基础配置到高级安全加固,全面解析SSH服务的各项参... 目录概述基础配置详解端口与监听设置主机密钥配置认证机制强化禁用密码认证禁止root直接登录实现双因素

解析C++11 static_assert及与Boost库的关联从入门到精通

《解析C++11static_assert及与Boost库的关联从入门到精通》static_assert是C++中强大的编译时验证工具,它能够在编译阶段拦截不符合预期的类型或值,增强代码的健壮性,通... 目录一、背景知识:传统断言方法的局限性1.1 assert宏1.2 #error指令1.3 第三方解决

在Linux终端中统计非二进制文件行数的实现方法

《在Linux终端中统计非二进制文件行数的实现方法》在Linux系统中,有时需要统计非二进制文件(如CSV、TXT文件)的行数,而不希望手动打开文件进行查看,例如,在处理大型日志文件、数据文件时,了解... 目录在linux终端中统计非二进制文件的行数技术背景实现步骤1. 使用wc命令2. 使用grep命令

Linux如何快速检查服务器的硬件配置和性能指标

《Linux如何快速检查服务器的硬件配置和性能指标》在运维和开发工作中,我们经常需要快速检查Linux服务器的硬件配置和性能指标,本文将以CentOS为例,介绍如何通过命令行快速获取这些关键信息,... 目录引言一、查询CPU核心数编程(几C?)1. 使用 nproc(最简单)2. 使用 lscpu(详细信

从入门到精通MySQL 数据库索引(实战案例)

《从入门到精通MySQL数据库索引(实战案例)》索引是数据库的目录,提升查询速度,主要类型包括BTree、Hash、全文、空间索引,需根据场景选择,建议用于高频查询、关联字段、排序等,避免重复率高或... 目录一、索引是什么?能干嘛?核心作用:二、索引的 4 种主要类型(附通俗例子)1. BTree 索引(

linux重启命令有哪些? 7个实用的Linux系统重启命令汇总

《linux重启命令有哪些?7个实用的Linux系统重启命令汇总》Linux系统提供了多种重启命令,常用的包括shutdown-r、reboot、init6等,不同命令适用于不同场景,本文将详细... 在管理和维护 linux 服务器时,完成系统更新、故障排查或日常维护后,重启系统往往是必不可少的步骤。本文

Redis 配置文件使用建议redis.conf 从入门到实战

《Redis配置文件使用建议redis.conf从入门到实战》Redis配置方式包括配置文件、命令行参数、运行时CONFIG命令,支持动态修改参数及持久化,常用项涉及端口、绑定、内存策略等,版本8... 目录一、Redis.conf 是什么?二、命令行方式传参(适用于测试)三、运行时动态修改配置(不重启服务