【工作必备知识】Linux磁盘I/O故障排查分析定位 iostat 介绍

本文主要是介绍【工作必备知识】Linux磁盘I/O故障排查分析定位 iostat 介绍,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【工作必备知识】Linux磁盘I/O故障排查分析定位 iostat 介绍

大家好,我是秋意零。

前言:今天,介绍Linux磁盘I/O故障排查时,必备命令iostat。该命令是监视系统I/O设备使用负载,它可以实时监视IO设备,从而帮助我们进行分析定位问题。

iostat 命令介绍

iostat 命令:监视系统I/O设备使用负载

语法:iostat [选项] [时间间隔 interval] [次数 count]

常用参数:

  • -c:显示CPU使用情况
  • -y:跳过不显示第一次报告的数据
  • -d:显示磁盘使用情况
  • -k:以KB为单位显示磁盘读写数据量
  • -m:以MB为单位显示磁盘读写数据量
  • -N:显示磁盘阵列(LVM)信息
  • -n:显示NFS使用情况
  • -p [磁盘]:显示指定磁盘或所有磁盘和分区的统计信息
  • -t:显示终端和CPU的信息
  • -x:显示详细信息,包括额外的设备和CPU统计
  • -V:显示版本信息

命令解析

1)iostat 默认输出

第一行:Linux 5.10.134-16.1.al8.x86_64 (blog) 06/10/2024 _x86_64_ (2 CPU)

参数解释
Linux 5.10.134-16.1.al8.x86_64 (blog)操作系统内核版本、主机名(blog)
06/10/2024统计日期(2024年6月10日)
x86_64系统是64位
(2 CPU)2个CPU核心

第二行,CPU的平均使用率(avg-cpu):avg-cpu: %user %nice %system %iowait %steal %idle

参数解释
%user用户态CPU时间占比,表示用户进程消耗的CPU时间百分比,< 60%
%nice以低优先级(nice)运行的用户进程占用的CPU时间百分比
%system内核态CPU时间占比,即操作系统内核自身消耗的CPU时间百分比,sy+us < 80%
%iowait(重要)I/O等待,表示CPU在空闲时因等待I/O操作完成所花费的时间百分比,< 30%
%steal在虚拟化环境中,被hypervisor强制其他VM占用的CPU时间百分比
%idleCPU空闲时间百分比

一般来说 %idle 持续游走在 20%以下,瓶颈出现在CPU的性能层面,%iowait 高而 %idle 在 70%以上,瓶颈出现在 I/O 设备层面

第三行,磁盘设备的I/O统计信息(Device):Device tps kB_read/s kB_wrtn/s kB_read kB_wrtn

参数解释
Device设备名dm 是 disk mapper 的缩写 可以在 /dev/mapper下查对应谁。参数-N 可以将 dm 转换成相应的 LVM名
tps每秒传输次数(Transactions Per Second),表示每秒磁盘完成的I/O操作数量
kB_read/s每秒从磁盘读取的数据量(以KB为单位),参数-m可以以MB为单位
kB_wrtn/s每秒向磁盘写入的数据量(以KB为单位)
kB_read总共从磁盘读取的数据量(以KB为单位)
kB_wrtn总共向磁盘写入的数据量(以KB为单位)

2)iostat 详细参数输出:iostat -x -d -y 1 3

参数解释:

  • r/s: 每秒读取操作次数
  • w/s: 每秒写入操作次数
  • rkB/s: 每秒从设备读取的数据量
  • wkB/s: 每秒向设备写入的数据量
  • rrqm/s: 每秒读请求合并次数,即读操作中有多少请求被合并执行
  • wrqm/s: 每秒写请求合并次数,同理,此处也没有写请求合并,值为0.00
  • %rrqm: 读请求合并的百分比,既然没有读请求合并,所以是0.00%
  • %wrqm: 写请求合并的百分比
  • r_await: 平均每次读操作的等待时间,包括等待时间和实际服务时间
  • w_await: 平均每次写操作的等待时间
  • aqu-sz: 平均I/O队列长度,也就是平均有多少个I/O请求在等待处理
  • rareq-sz: 平均读请求大小
  • wareq-sz: 平均写请求大小
  • svctm: 平均服务时间,即I/O操作实际处理时间
  • %util: 设备利用率

%util 表示该设备有I/0非空闲的时间比率,不考虑I/0有多少。由于硬盘设备有并行处理多个I/0请求的能力,所以%util即使达到100%也不意味着设备饱和了。

r_await、w_await 多大算有问题?

一般情况下:

  • 对于机械硬盘(HDD),如果r_awaitw_await持续高于10-20毫秒,可能表明存在I/O延迟问题(机械硬盘 await=寻道延迟+旋转延迟+传输延迟rpm 10000为8.38ms)
  • 对于固态硬盘(SSD),由于其更快的读写速度,理想的r_awaitw_await应该更低,通常认为超过1-5毫秒可能需要关注

End

参考:

Linux I/O问题排查 哪个设备的问题 iostat命令详解_哔哩哔哩_bilibili

运维工程师系列-掌握iostat命令给你月薪加1000_哔哩哔哩_bilibili

这篇关于【工作必备知识】Linux磁盘I/O故障排查分析定位 iostat 介绍的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1050144

相关文章

Redis连接失败:客户端IP不在白名单中的问题分析与解决方案

《Redis连接失败:客户端IP不在白名单中的问题分析与解决方案》在现代分布式系统中,Redis作为一种高性能的内存数据库,被广泛应用于缓存、消息队列、会话存储等场景,然而,在实际使用过程中,我们可能... 目录一、问题背景二、错误分析1. 错误信息解读2. 根本原因三、解决方案1. 将客户端IP添加到Re

Linux磁盘分区、格式化和挂载方式

《Linux磁盘分区、格式化和挂载方式》本文详细介绍了Linux系统中磁盘分区、格式化和挂载的基本操作步骤和命令,包括MBR和GPT分区表的区别、fdisk和gdisk命令的使用、常见的文件系统格式以... 目录一、磁盘分区表分类二、fdisk命令创建分区1、交互式的命令2、分区主分区3、创建扩展分区,然后

Linux中chmod权限设置方式

《Linux中chmod权限设置方式》本文介绍了Linux系统中文件和目录权限的设置方法,包括chmod、chown和chgrp命令的使用,以及权限模式和符号模式的详细说明,通过这些命令,用户可以灵活... 目录设置基本权限命令:chmod1、权限介绍2、chmod命令常见用法和示例3、文件权限详解4、ch

Linux内核之内核裁剪详解

《Linux内核之内核裁剪详解》Linux内核裁剪是通过移除不必要的功能和模块,调整配置参数来优化内核,以满足特定需求,裁剪的方法包括使用配置选项、模块化设计和优化配置参数,图形裁剪工具如makeme... 目录简介一、 裁剪的原因二、裁剪的方法三、图形裁剪工具四、操作说明五、make menuconfig

Redis主从复制实现原理分析

《Redis主从复制实现原理分析》Redis主从复制通过Sync和CommandPropagate阶段实现数据同步,2.8版本后引入Psync指令,根据复制偏移量进行全量或部分同步,优化了数据传输效率... 目录Redis主DodMIK从复制实现原理实现原理Psync: 2.8版本后总结Redis主从复制实

Linux使用nohup命令在后台运行脚本

《Linux使用nohup命令在后台运行脚本》在Linux或类Unix系统中,后台运行脚本是一项非常实用的技能,尤其适用于需要长时间运行的任务或服务,本文我们来看看如何使用nohup命令在后台... 目录nohup 命令简介基本用法输出重定向& 符号的作用后台进程的特点注意事项实际应用场景长时间运行的任务服

什么是cron? Linux系统下Cron定时任务使用指南

《什么是cron?Linux系统下Cron定时任务使用指南》在日常的Linux系统管理和维护中,定时执行任务是非常常见的需求,你可能需要每天执行备份任务、清理系统日志或运行特定的脚本,而不想每天... 在管理 linux 服务器的过程中,总有一些任务需要我们定期或重复执行。就比如备份任务,通常会选在服务器资

不删数据还能合并磁盘? 让电脑C盘D盘合并并保留数据的技巧

《不删数据还能合并磁盘?让电脑C盘D盘合并并保留数据的技巧》在Windows操作系统中,合并C盘和D盘是一个相对复杂的任务,尤其是当你不希望删除其中的数据时,幸运的是,有几种方法可以实现这一目标且在... 在电脑生产时,制造商常为C盘分配较小的磁盘空间,以确保软件在运行过程中不会出现磁盘空间不足的问题。但在

锐捷和腾达哪个好? 两个品牌路由器对比分析

《锐捷和腾达哪个好?两个品牌路由器对比分析》在选择路由器时,Tenda和锐捷都是备受关注的品牌,各自有独特的产品特点和市场定位,选择哪个品牌的路由器更合适,实际上取决于你的具体需求和使用场景,我们从... 在选购路由器时,锐捷和腾达都是市场上备受关注的品牌,但它们的定位和特点却有所不同。锐捷更偏向企业级和专

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发