使用smartmontools查看SSD的寿命

2024-03-06 01:44

本文主要是介绍使用smartmontools查看SSD的寿命,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 一、smartmontools是什么?
  • 二、下载
  • 三、使用
    • 1.SATA&NVME
      • 1.建兴
      • 2.金士顿
      • 3.Intel SSD
      • 4.西数
      • 5.铠侠
      • 6.三星
      • 7.影驰
    • 2.RAID
      • 1.MegaRAID
      • 2.PERC
      • 3.浪潮PM8204-2G
      • 4.AacRaid
      • 5.3ware RAID
      • 6.Areca SATA RAID
      • 7.cciss RAID
  • 总结


前言

硬盘已经成为生活中的必需品了,小到家里的PC,大到公司的服务器处处离不开硬盘。没有人希望突然有一天电脑开不了机,原因竟然是硬盘损坏。虽然有时候硬盘损害前可能有一些先兆,不排除人也有大意的时候。这个时候,监控硬盘健康度就显得很重要了,至少不会让重要的数据惨遭厄运。硬盘损坏是我的亲身经历,现在想起来还痛心疾首!


一、smartmontools是什么?

The smartmontools package contains two utility programs (smartctl and smartd) to control and monitor storage systems using the Self-Monitoring, Analysis and Reporting Technology System (SMART) built into most modern ATA/SATA, SCSI/SAS and NVMe disks. In many cases, these utilities will provide advanced warning of disk degradation and failure.

一言以蔽之,检测硬盘SMART信息的工具。

二、下载

Ubuntu自带这个包,只需要使用apt安装即可,这一步没什么好说的。

sudo apt update
sudo apt install smartmontools

三、使用

我们要使用的就是这个工具smartctl,基本都是围绕着它来进行的。这里要分很多种情况,如果你的SSD是直接介入到SATA控制器或NVME控制器的,那么直接放心大胆的用就行了。如果你是服务器场景,SSD接到RAID控制器的,那么要费一番周折了,后面会讲。

1.SATA&NVME

最普遍的额场景是家用PC或笔记本电脑,这些设备一般都空间有限,存储的数据可能没服务器那么重要,基本都不太会使用RAID。

自从SSD出现之后,大量的厂家进入这个市场瓜分蛋糕,在这里其实不是每个厂家的SMART信息都是一样的。我手上用过三星、影驰、建兴、金士顿、铠侠等等品牌,接下来我就根据我用过的SSD来分别说明。

1.建兴

测试型号:LITEON CV8-8E128-11 SATA 128GB

sudo smartctl -a /dev/sda -S on输出
=== START OF INFORMATION SECTION ===
Device Model:     LITEON CV8-8E128-11 SATA 128GB
Serial Number:    *****************
LU WWN Device Id: 5 002303 101343e90
Firmware Version: C27110B
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      M.2
TRIM Command:     Available, deterministic, zeroed
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Mar  5 11:06:03 2024 CST
SMART support is: Available - device has SMART capability.SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE5 Reallocated_Sector_Ct   0x0003   100   100   000    Pre-fail  Always       -       09 Power_On_Hours          0x0002   100   100   000    Old_age   Always       -       302312 Power_Cycle_Count       0x0003   100   100   000    Pre-fail  Always       -       2296
175 Program_Fail_Count_Chip 0x0003   100   100   000    Pre-fail  Always       -       0
176 Erase_Fail_Count_Chip   0x0003   100   100   000    Pre-fail  Always       -       0
177 Wear_Leveling_Count     0x0003   100   100   000    Pre-fail  Always       -       213
178 Used_Rsvd_Blk_Cnt_Chip  0x0003   100   100   000    Pre-fail  Always       -       0
179 Used_Rsvd_Blk_Cnt_Tot   0x0003   100   100   000    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0003   100   100   005    Pre-fail  Always       -       93
181 Program_Fail_Cnt_Total  0x0003   100   100   000    Pre-fail  Always       -       0
182 Erase_Fail_Count_Total  0x0003   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0003   100   100   000    Pre-fail  Always       -       0
194 Temperature_Celsius     0x0002   100   100   000    Old_age   Always       -       29
195 Hardware_ECC_Recovered  0x0003   100   100   000    Pre-fail  Always       -       0
199 UDMA_CRC_Error_Count    0x0003   100   100   000    Pre-fail  Always       -       0
238 Unknown_Attribute       0x0003   090   090   000    Pre-fail  Always       -       90
241 Total_LBAs_Written      0x0003   100   100   000    Pre-fail  Always       -       18244761127
242 Total_LBAs_Read         0x0003   100   100   000    Pre-fail  Always       -       11662360995

我这款盘是建兴128G MLC的,使用的接口是M.2 2280,协议走的是SATA3。重点看这个参数:Wear_Leveling_Count这是全盘擦写次数的意思,一般MLC的擦写寿命在3000-10000之间,从数据上看我这个电脑用了好久了寿命还是100%,这是TLC不能比拟的。

2.金士顿

测试型号:KINGSTON SH103S3480G

sudo smartctl -a /dev/sda -S on输出
=== START OF INFORMATION SECTION ===
Model Family:     SandForce Driven SSDs
Device Model:     KINGSTON SH103S3480G
Serial Number:    *****************
LU WWN Device Id: 5 0026b7 23b01a009
Firmware Version: 521ABBF0
User Capacity:    480,103,981,056 bytes [480 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
TRIM Command:     Available
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS, ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Mar  5 10:43:17 2024 CST
SMART support is: Available - device has SMART capability.
SMART support is: EnabledSMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE1 Raw_Read_Error_Rate     0x0033   095   095   050    Pre-fail  Always       -       0/649489405 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       09 Power_On_Hours_and_Msec 0x0032   060   060   000    Old_age   Always       -       35599h+44m+40.970s12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1419
171 Program_Fail_Count      0x000a   000   000   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       125
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   023   044   000    Old_age   Offline      -       23 (Min/Max 8/44)
194 Temperature_Celsius     0x0022   023   044   000    Old_age   Always       -       23 (Min/Max 8/44)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/64948940
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/64948940
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/64948940
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       20744
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       16053
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       16053
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       13813

运气很好,这块还是MLC的还是480G的容量,官方给定的总写入数据量1785TBW,目前已经写入16053GB。这块SSD和建兴不一样,要看SSD_Life_Left这个字段,目前依然是100%寿命,说起来也用了好几年了,只能说MLC寿命依然是王者,只可惜以后消费市场基本是TLCQLC的天下了,想买MLC恐怕不容易了。

3.Intel SSD

测试产品:INTEL SSDSC2KB960G8

sudo smartctl -a /dev/sda -S on输出
=== START OF INFORMATION SECTION ===
Device Model:     INTEL SSDSC2KB960G8
Serial Number:    ******************
LU WWN Device Id: 5 5cd2e4 150a52b66
Firmware Version: XCV10120
User Capacity:    960,197,124,096 bytes [960 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Mar  5 10:08:04 2024 CST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Attribute Autosave Enabled.SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       09 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       3110812 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       27
170 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       0
171 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
174 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       17
175 Program_Fail_Count_Chip 0x0033   100   100   010    Pre-fail  Always       -       120259021263
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   082   073   000    Old_age   Always       -       18 (Min/Max 13/28)
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       17
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       18
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
225 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       953953
226 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       542
227 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       84
228 Power-off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       1866299
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   100   100   000    Old_age   Always       -       0
234 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
235 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       120259021263
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       953953
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       5388177
243 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       1988132

这块是服务器级别的SSD,和普通的消费级略有差异,价格也不便宜。看了官方介绍是64-Layer TLC 3D Nand,以为是战五渣,没想到居然是王者,寿命达到了恐怖的3.5 PBW,平均故障时间200万小时。这块SSD要看Media_Wearout_Indicator这个参数,依然是100%寿命,可以放心使用了,等降到10%左右就可以考虑换硬盘了,很多服务器都是两块组RAID 1,基本稳了!

4.西数

测试产品:WD Blue SN570 500GB SSD
这个SSD我是用在Windows办公电脑上的,没装Linux,所以我在Windows上看了下,Linux上看到的Smart信息应该是一样的。这里要区分下因为M.2的SSD我见过的就两种协议,第一种就是NVME协议,第二种是SATA协议。如果走NVME协议,设备名就是/dev/nvme*(/dev/nvme0n1p1就是第一块NVME硬盘的第一个分区①),如果走的SATA协议,设备名就是/dev/sd*(/dev/sda1就是第一块SATA硬盘的第一个分区)。

注:M.2只是硬件接口规格,不是所有的M.2都是1000MB+的顺序速度,SATA也就600MB左右,以后买硬盘不要被别人忽悠了!

①:NVME协议的硬盘使用p1、p2、p3...来区分不同的分区。

sudo smartctl -a /dev/nvme0n1 -S on如果不行就试试下面的
sudo smartctl -a -d nvme /dev/nvme0n1 -S on输出
=== START OF INFORMATION SECTION ===
Model Number:                       WD Blue SN570 500GB SSD
Serial Number:                      **********
Firmware Version:                   234110WD
PCI Vendor/Subsystem ID:            0x15b7
IEEE OUI Identifier:                0x001b44
Total NVM Capacity:                 500,107,862,016 [500 GB]
Unallocated NVM Capacity:           0
Controller ID:                      0
NVMe Version:                       1.4
Number of Namespaces:               1
Namespace 1 Size/Capacity:          500,107,862,016 [500 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            ***** **********
Local Time is:                      Tue Mar  5 13:52:35 2024 CST
Firmware Updates (0x14):            2 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Log Page Attributes (0x1e):         Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg Pers_Ev_Lg
Maximum Data Transfer Size:         128 Pages
Warning  Comp. Temp. Threshold:     80 Celsius
Critical Comp. Temp. Threshold:     85 Celsius
Namespace 1 Features (0x02):        NA_FieldsSupported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat0 +     3.70W    3.10W       -    0  0  0  0        0       01 +     2.70W    2.10W       -    0  0  0  0        0       02 +     1.90W    1.80W       -    0  0  0  0        0       03 -   0.0250W       -        -    3  3  3  3     3900   110004 -   0.0050W       -        -    4  4  4  4     5000   44000Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf0 +     512       0         21 -    4096       0         1=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSEDSMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        36 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    1,170,348 [599 GB]
Data Units Written:                 1,521,702 [779 GB]
Host Read Commands:                 11,926,746
Host Write Commands:                16,193,571
Controller Busy Time:               41
Power Cycles:                       168
Power On Hours:                     884
Unsafe Shutdowns:                   90
Media and Data Integrity Errors:    0
Error Information Log Entries:      1
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0Error Information (NVMe Log 0x01, 16 of 256 entries)

这块是货真价实的M.2插槽,NVME协议SSD,只不过材质是TLC的,号称3500MB的顺序读取和2500MB的顺序写入,官方号称平均无故障时间150万小时,只可惜写入寿命只有可怜的300TBW,TLC差不多都这个尿性,毕竟一分钱一分货,综合还是比刚出来的那会好很多了。

5.铠侠

测试设备:KBG40ZNS512G NVMe KIOXIA 512GB 512.1 GB
由于装在Windows上,所以我直接取Windows上的数据了,smartctl查看方式和WD BLue一样的。

/dev/nvme0n1就是你的SSD,不同的机器可能名字不一样
sudo smartctl -a /dev/nvme0n1 -S on

在这里插入图片描述
这块也是货真价实的NVME的SSD,颗粒是112-layer BiCS FLASH™ 3D TLC的,最大写入量也是300TBW。主要看Percentage used这一项,显示寿命使用了8%,还剩92%,这比较符合TLC的寿命表现,作为系统盘+游戏盘,这个表现能说的过去。

6.三星

测试设备:SAMSUNG MZ7LM480HCHP-00003 480.1 GB
由于装在Windows上,所以我直接取Windows上的数据了。

SATA协议
sudo smartctl -a /dev/sda -S on

在这里插入图片描述
SMART参数和前面的Intel很像,主要看Wear_Leveing_Count这一项,显示使用了1%,还剩99%的寿命。这个是三星的数据中心系列产品,写入寿命为0.8DWPD,和我们之前看到的表示方法不一样,这个是Drive Writes Per Day,就是每天写满磁盘次数,这个地方是0.8就是说每天能写满384GB,然后这个状态可以持续3年(?),实际的写入量就是3365384GB。

7.影驰

测试产品:GALAX GX0240L9A080-C1 240.0 GB
这个产品有点年头了,是我买的第一款影驰的SSD,当时就是图便宜,还是MLC。同样是装Windows系统的,没有装Linux。

sudo smartctl -a /dev/sda -S on

在这里插入图片描述
感觉应该是哪里有些问题,256G还是MLC仅仅做系统盘的话不应该损耗这么大,也可能是检测软件的问题。现在估计也没人用这么旧的SSD了,随便看看就好。

2.RAID

前面说的都是直接接在SATA控制器或NVME控制器上的SSD,还有一种隐藏在RAID后面的这种方法就不行了。针对不同的RAID控制器,smartctl有不同的方法去获取SSD健康信息。我们的服务器主要是基于MegaRAID的,其它的RAID用的不多,不过我会给出来命令,你可以自行尝试,等我用过这些产品再补充。

1.MegaRAID

需要下载专用的工具megacli,这种方式直接在系统里看就行了,不需要跳转BIOS,也不会对设备运行产生任何影响。下面的操作基于你已经有megacli了,如果没有请看下面的安装方法。
MegaCLI安装方法

获取Device ID
sudo megacli -PDList -aALL输出
Enclosure Device ID: 252
Slot Number: 0
Drive's position: DiskGroup: 0, Span: 0, Arm: 0
Enclosure position: N/A
Device Id: 5
WWN: 55cd2e4150a52b66
Sequence Number: 2
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SATA

找到你想看的设备的Device id,上面的是5,一会要用到。

sudo smartctl -a -d megaraid,5 /dev/sdd -S on

输出和SATA&NVME的设备一样,这里不细说了。

megaraid,5:megaraid后面的5就是刚才的Device id,每个硬盘都有一个独一无二的Device id,哪怕是分到同一个RAID下的硬盘Device id也是不一样的。

2.PERC

Dell PERC (PowerEdge RAID Controller), computer hardware used in Dell PowerEdge servers。
这个和MegaRAID一样需要安装一个工具perccli,我手上的RAID控制器是PERC H330 Mini,属于Dell PERC 9系列产品。隐藏在这个RAID控制器下的硬盘通过megaraid的方法也可以获取到Smart信息,但是megacli不能用来管理PERC的设备,这个回头会说。

perccli的安装方式回头我会补上,我的服务器系统是Ubuntu-18.04,有需要的可以先在我的资源里下载,后续我会教你们自己安装移植。
perccli.tar

安装方法
tar -xmf perccli.tar
sudo mkdir /opt/MegaRAID
sudo mv perccli /opt/MegaRAID
sudo ln -s /opt/MegaRAID/perccli/perccli64 /usr/sbin/perccli64

接着我们只要使用perccli64拿到DID就可以查询Smart信息了。

sudo perccli64 /c0 show all输出
Physical Drives = 8PD LIST :
=======---------------------------------------------------------------------------
EID:Slt DID State DG      Size Intf Med SED PI SeSz Model               Sp
---------------------------------------------------------------------------
32:0      0 Onln   0 893.75 GB SATA SSD N   N  512B INTEL SSDSC2KB960G8 U
32:1      1 Onln   0 893.75 GB SATA SSD N   N  512B INTEL SSDSC2KB960G8 U
32:2      2 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:3      3 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:4      4 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:5      5 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:6      6 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:7      7 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
---------------------------------------------------------------------------

看DID那一栏,那就是我们要找的设备ID,类似于MegaRAID的Device id。我的服务器有8块硬盘,两块SSD组成了RAID 1,另外6块组成了RAID 1+0,这个后面会说,想看哪个SSD就用哪个DID就行了。

sudo smartctl -a -d megaraid,0 /dev/sdd -S on

megaraid,0:就是第一块SSD,这台机器上所有的硬盘都是隐藏在RAID后面的SSD,都可以用这种方法看。

补充:之前留下了问题,为什么megacli不能配置PERC 9的设备。请看下面:

在PERC 9的设备上看RAID级别
sudo megasasctl输出
a0       PERC H330 Mini           encl:1 ldrv:2  batt:FAULT, module missing, pack missing, charge failed
a0d0       893GiB RAID 1   1x2  optimal
a0d1           0B RAID 17   1x6  optimal
a0e32s0     894GiB  a0d0  online
a0e32s1     894GiB  a0d0  online
a0e32s2    7452GiB  a0d1  online
a0e32s3    7452GiB  a0d1  online
a0e32s4    7452GiB  a0d1  online
a0e32s5    7452GiB  a0d1  online
a0e32s6    7452GiB  a0d1  online
a0e32s7    7452GiB  a0d1  online

看到问题没有直接蹦出个RAID 17,我是没听说过还有这种RAID,也许是我孤陋寡闻,我查了各种资料也没找到答案,stackoverflow上一个老外也在问这个问题,搞不好他是和我一样的情形。直到我找到perccli这个工具。一个属于PERC 9自己的工具,我才恍然大悟!。

使用perccli64查看
sudo perccli64 /c0 show all输出
Virtual Drives = 2VD LIST :
=======---------------------------------------------------------------
DG/VD TYPE   State Access Consist Cache Cac sCC      Size Name
---------------------------------------------------------------
0/0   RAID1  Optl  RW     Yes     NRWTD -   OFF 893.75 GB
1/1   RAID10 Optl  RW     Yes     NRWTD -   OFF 21.830 TB
---------------------------------------------------------------

RAID10才是庐山真面目,还是工具用的不对。不过,这不能怪开发者,因为RAID Controller型号实在是太多了,光Dell一家也得有几十种吧,更不用说还有浪潮、华为、Supermicro等一票大厂。

这里多说一句,每块磁盘8TB(实际可用7.3TB左右),每两块磁盘先组成RAID 1,然后3组RAID 1组成RAID 0。就是说哪怕这三组RAID 1同时各坏了一块硬盘数据完整性也能保证,只需要定位故障硬盘,热插拔更换故障硬盘就行了,RAID会自动重建数据的。.

3.浪潮PM8204-2G

我手上的这个控制器市在Windows系统上,暂时先预留着,后面遇到了再说。

4.AacRaid

这个我手上也没有现成的,方法在下面:

sudo smartctl -a -d aacraid,0,0,2 /dev/sda

aacraid,0,0,2:0,0,2对应着(Host number, Lun, ID),你可以通过相关工具获取上面三个值。

5.3ware RAID

这个我手上也没有现成的,方法在下面:

sudo smartctl -a -d 3ware,2 /dev/sda

3ware,2:2对应应该也是设备ID,范围是0-127

6.Areca SATA RAID

这个我手上也没有现成的,参考方法在下面:

sudo smartctl -a -d areca,2 /dev/sg2

areca,2:也是和设备ID相关的,范围是1-24

7.cciss RAID

这个我手上也没有现成的,参考方法在下面:

sudo smartctl -a -d cciss,0 /dev/cciss/c0d0

cciss,0:0类似于设备ID,范围从0-15

注:除MegaRAID和PERC 9以外,其它RAID未经过测试,感兴趣的可以尝试下!


总结

1、SATA和NVME的主要区别是设备名字不一样
2、隐藏再RAID后面的设备不能直接看,需要借助RAID CLI
3、不要等到寿命快消耗完了才想到更换,应该早做打算。一般剩10%就应该特别注意了。
4、还有一点需要注意,这种方法不是万能的,有时候可能整体是健康的突然坏了,比如之前的固件门

这篇关于使用smartmontools查看SSD的寿命的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/778469

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念