Linux之慢盘检测

2023-10-18 23:20

文章标签 linux 检测之慢

本文主要是介绍Linux之慢盘检测，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

慢盘检测

常见的慢盘检测工具
判断方法
- 判断磁盘为慢盘的阈值

前面介绍iostat的文章中提到过

iostat工具没有任何一输出项表示的是硬盘设备平均每次IO的时间
也不能直接通过 /proc/diskstats 提供的统计值来准确地计算 I/O 在磁盘上的耗时

常见的慢盘检测工具

常见的慢盘检测工具例如，ARIES、华为IBMA都是通过周期性读取内核提供的统计信息（/proc/diskstats）来计算磁盘的平均 I/O 服务时间（svctm），并将服务时间划分为不同的3个等级level0/level1/level2，每个等级对应不同的加权值：

轻微(level0)： 0ms
一般(level1)：100ms
严重(level2)：200ms

ARIES 慢盘判断方法:

每1s中采集一次平均I/O服务时间，并判断 svctm 处在的权重区间，对应区间计数；
每30分钟判断一次是否命中慢盘，判断方法：一般次数 * 1 + 严重次数 * 2 > 20% * 1800，则判定为慢盘；
对于命中为慢盘，则标记为本周期内命中慢盘次数+1；
一天24h内，命中慢盘次数超过80%，则直接调用坏盘逻辑。

华为提供的慢盘判断方法：

每1s中采集一次平均I/O服务时间（svctm），并判断 svctm 处在的权重区间，对应区间计数；
每5分钟判断一次是否命中慢盘，判断方法：一般次数 * 1 + 严重次数 * 2 > 20% * 300，则判定为慢盘；
两种方法都依赖于计算的 svctm，实际上这个值在新版本的 iostat 中被废弃，因为它并不能代表实际的 I/O服务时间。

判断方法

尽管如此，还是可以通过iostat中计算svctm的方法来预估每IO的平均服务时间。
(虽然blktrace能够追踪每次 I/O 将 request 提交给驱动到请求完成的耗时，但是 blktrace 会增加I/O 的耗时从而影响性能)

理由如下：
虽然 svctm 不能准确地表示I/O的服务时间，但是当出现慢盘时，无论传统的 sata hdd 盘还是 nvme ssd，svctm 都会因为单次 I/O 耗时增加而增加，svctm 会增加到几百毫秒，甚至几千毫秒。所以继续使用 svctm 来判断慢盘。

判断磁盘为慢盘的阈值

磁盘类型	level1(ms)	level2(ms)
hdd	30	60
sata ssd	20	40
nvme ssd	10	20

说明：值除了 hdd 的阈值有据可循，其他两种磁盘都是推算值

普通 sata ssd 读QPS 能达到五百以上，所以当 iops 下降到 50，说明磁盘已经出现慢盘
nvme ssd iops 能达到一千到几十万，当iops 下降到 100，说明磁盘已经出现慢盘

每 1s 中采集一次 /sys/block/disk name/stat，并计算svctm，并判断 svctm 处在的权重区间，对应区间计数；

当本次计算的平均 svctm 超过报警值就将慢盘次数加1，如果平均耗时超过危险值就将慢盘次数加2；
慢盘次数 = 一般次数 * 1 + 严重次数 * 2
如果过去一段时间内（默认3分钟）慢盘次数超过统计次数的 20% 则报警慢盘（总数 = 3*60 - 没有请求的秒）；
如果过去一长段时间内（默认30分钟）磁盘被报警慢盘周期（一个周期为3分钟）次数超过 20%（除去没有请求的周期），则报警慢盘
如果过去一长段时间内（默认180分钟）磁盘被报警慢盘周期次数超过 80%（除去没有请求的周期），磁盘则在保证数据安全的前提下不提供服务

这篇关于Linux之慢盘检测的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/235739。 23002807@qq.com

相关文章

Linux换行符的使用方法详解

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

阅读更多...

Linux系统配置NAT网络模式的详细步骤(附图文)

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

阅读更多...

Linux系统中卸载与安装JDK的详细教程

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

阅读更多...

Linux卸载自带jdk并安装新jdk版本的图文教程

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

阅读更多...

Linux samba共享慢的原因及解决方案

Linux samba共享慢的原因及解决方案

《Linuxsamba共享慢的原因及解决方案》：本文主要介绍Linuxsamba共享慢的原因及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux samba共享慢原因及解决问题表现原因解决办法总结Linandroidux samba共享慢原因及解决

阅读更多...

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版，这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日（3 月 27 日）放出了 Beta 版 Ubuntu 25.04 系统镜像，代号“Pluc

阅读更多...

Linux安装MySQL的教程

Linux安装MySQL的教程

《Linux安装MySQL的教程》：本文主要介绍Linux安装MySQL的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux安装mysql1.Mysql官网2.我的存放路径3.解压mysql文件到当前目录4.重命名一下5.创建mysql用户组和用户并修

阅读更多...

Linux上设置Ollama服务配置(常用环境变量)

Linux上设置Ollama服务配置(常用环境变量)

《Linux上设置Ollama服务配置(常用环境变量)》本文主要介绍了Linux上设置Ollama服务配置(常用环境变量),Ollama提供了多种环境变量供配置,如调试模式、模型目录等,下面就来介绍一... 目录在 linux 上设置环境变量配置 OllamPOgxSRJfa手动安装安装特定版本查看日志在

阅读更多...

Linux系统之主机网络配置方式

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》：本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

阅读更多...

Linux系统之dns域名解析全过程

Linux系统之dns域名解析全过程

《Linux系统之dns域名解析全过程》：本文主要介绍Linux系统之dns域名解析全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、dns域名解析介绍1、DNS核心概念1.1 区域 zone1.2 记录 record二、DNS服务的配置1、正向解析的配置

阅读更多...