干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)

2024-03-09 06:32

本文主要是介绍干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

今年春招的时候,那是一个春意盎然的下午,我正在进行一场没有硝烟的战争——面试。我特别清楚地记得,那天是我接种新冠疫苗后的第二天,脑子晕乎乎的,感觉自己没有开机,所以面试过程中回答得不尽人意。(但是面试官真的人很好哈哈哈)

img

鲁迅先生说过:“真正的勇士,敢于直面惨淡的人生”,而我需要敢于直面糟糕的面试

面试结束后,我就赶紧将面试过程中问到的问题记录了下来,并打算做一个复盘

img

其中,让我印象最深的便是“你跟我说说什么是平均负载以及什么是CPU使用率,它们之间有什么关系吗

平均负载

我们先来说说什么是平均负载

我们在终端输入 top 命令或者 uptime 命令,就能显示出系统过去1 分钟、5 分钟、15 分钟的平均负载(如图所示,红框部分)

img

  • 平均负载是指单位时间内,处在可执行状态和不可中断睡眠状态的进程的平均数。也就是说,它包括了处在执行态,阻塞态和就绪态的进程。

可能有小伙伴会问,什么是可执行状态的进程和不可中断睡眠状态的进程?

其中,**可执行状态的进程包括正在被CPU执行的进程以及在就绪队列上等待CPU执行的进程,**也就是我们常用 ps 命令看到的,处于 R 状态(Running 或 Runnable)的进程(也就是进程的三个基本状态中的执行态和就绪态)

而不可中断睡眠状态的进程即指处于内核关键流程中的进程,并且这些流程不可被打断。比如最常见的就是等待硬件设备的I/O响应。也就是我们在 ps 命令中看到的 D 状态(Uninterruptible Sleep,也称为 Disk Sleep)的进程(也就是进程的三个基本状态中的阻塞态)。

介绍完了什么是平均负载后,可能有小伙伴又会问:怎么判断系统的负载情况是否过大过小呢?

这里我举一个简单的例子

假设系统上有两个CPU:如果负载为1,那么意味着CPU有百分之50的空闲如果负载为2,那么意味着所有的CPU都刚好被完全占用如果负载为4,那么意味着有超过一半的进程竞争不到CPU

如何判断系统的平均负载是否合理?

  • 如果 1 分钟、5 分钟、15 分钟的三个值基本相同,或者相差不大,那就说明系统负载很平稳。
  • 但如果 1 分钟的值远小于 15 分钟的值,就说明系统最近 1 分钟的负载在减少,而过去 15 分钟内却有很大的负载,即系统的负载在逐渐减少。
  • 反过来,如果 1 分钟的值远大于 15 分钟的值,就说明最近 1 分钟的负载在增加,这种增加有可能只是临时性的,也有可能还会持续增加下去,所以就需要持续观察。一旦 1 分钟的平均负载接近或超过了 CPU 的个数,就意味着系统正在发生过载的问题,这时就得分析调查是哪里导致的问题,并要想办法优化了。
  • 在实际生产环境中,当平均负载高于 CPU 数量 70% 的时候,我们就应该分析排查负载高的问题了。一旦负载过高,就可能导致进程响应变慢,进而影响服务的正常功能

这里我再举个简单的例子:

假设我们在一个只有一个CPU的系统上看到平均负载为:1.73,0.60,7.98。那么说明在过去1分钟内,系统有73%的超载,在过去15分钟内,系统更是达到了698%的超载,但就整体趋势来看,系统的负载是逐渐降低的。

CPU使用率

讲完平均负载,我们再来了解一下CPU使用率。

CPU使用率是指在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

比如说:比如说单核CPU一秒内处在非空闲态的时间为0.6秒,那么它的CPU使用率就是60%而双核CPU一秒内处在非空闲态的时间分别为0.6s和0.4s,那么它的CPU使用率为(0.4+0.6)/ 2 * 100% = 50%

看到这里,想必大家都对这两个概念有一个大体上的了解了吧

总的来说,系统负载或者说系统的平均负载,它的参考标准是进程数;而CPU使用率的参考标准是CPU的忙碌时

俗话说:“NO PICTURE NO BB ”,为了让大家更直观的感受这两个概念的区别,我将会配合着图再讲解一个例子:

有一家银行,他只有一个业务窗口,每次只能接待一个人(单核CPU)。有一天一共有五个人来了,那么就会出现一人在办理手续,其余四人在等待的情况(CPU负载为5)我们约定在业务窗口的那个人只有真正在办理业务才算是真正使用这个窗口,才算意味着窗口在忙碌(CPU使用率)

在这里插入图片描述

平均负载和CPU使用率的关系

在介绍完了这两个概念之后,真正的重点内容才刚刚开始

前面我们说到,面试官的最后一个问题就是:平均负载和CPU使用率的关系

也就是说CPU使用率的升高与下降跟平均负载的增大与减小有没有什么关系,我将通过下面这个案例来跟大家讲解一下。

CPU使用率高的情况

案例开始前,我先简单说明一下本次案例的虚拟机的配置

  • 内存1GB
  • 一个CPU
  • 版本:CentOS 7.6

首先下载相关工具包

其中 sysstat 工具是用来查看系统的整体性能情况的,例如CPU使用率和平均负载这些指标,而 stress 则是一个压力测试工具,用来模拟出各种性能压力

# 下载相关工具包yum install -y sysstat stress

之后我们使用 stress 工具来模拟CPU使用率为100%

#--timeout 600:持续时间为600s
stress --cpu 1 --timeout 600

接着等待一段时间,我们来看一下系统的平均负载情况

uptime... load average: 1.11, 0.59, 0.29

可以看到,在单核CPU系统里,过去的时间里的平均负载是在逐渐上升的,而过去1分钟内的平均负载甚至达到了1.11,这说明CPU已经被完全占满。

我们使用 sysstat 工具包中的 mpstat 查看 cpu 性能情况

mpstat -P ALL 5

在这里插入图片描述

这里我们可以看到,用户态CPU使用率已经达到了100%

总结:CPU使用率的升高会导致系统平均负载的上升

除此之外:

  • 系统内出现大量等待I/O的进程(系统I/O压力大)的时候也会导致平均负载升高,但是CPU使用率不一点升高
  • 系统内出现大量的进程,进程数远远超过了CPU数量的情况下也会导致平均负载的升高和CPU使用率的升高

总结

我们来回顾一下今天所学的内容:

  • 系统负载:指处在可执行状态和不可中断状态的进程的总数

    • 可执行状态的进程:表示正在被CPU执行的和在就绪队列中等待被CPU执行的进程
    • 不可中断状态进程:表示当前该进程正在等待某种事件的响应,并且这个状态是不可被打断的,比较常见的有跟硬件交互的时候、等待硬件I/O
  • 系统平均负载:单位时间内处在可执行状态和不可中断状态的进程的平均数

  • CPU使用率:表示在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

  • CPU使用率升高会导致系统平均负载的升高

在这里插入图片描述

这篇关于干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/789798

相关文章

MySql基本查询之表的增删查改+聚合函数案例详解

《MySql基本查询之表的增删查改+聚合函数案例详解》本文详解SQL的CURD操作INSERT用于数据插入(单行/多行及冲突处理),SELECT实现数据检索(列选择、条件过滤、排序分页),UPDATE... 目录一、Create1.1 单行数据 + 全列插入1.2 多行数据 + 指定列插入1.3 插入否则更

Linux进程CPU绑定优化与实践过程

《Linux进程CPU绑定优化与实践过程》Linux支持进程绑定至特定CPU核心,通过sched_setaffinity系统调用和taskset工具实现,优化缓存效率与上下文切换,提升多核计算性能,适... 目录1. 多核处理器及并行计算概念1.1 多核处理器架构概述1.2 并行计算的含义及重要性1.3 并

nginx 负载均衡配置及如何解决重复登录问题

《nginx负载均衡配置及如何解决重复登录问题》文章详解Nginx源码安装与Docker部署,介绍四层/七层代理区别及负载均衡策略,通过ip_hash解决重复登录问题,对nginx负载均衡配置及如何... 目录一:源码安装:1.配置编译参数2.编译3.编译安装 二,四层代理和七层代理区别1.二者混合使用举例

Linux下进程的CPU配置与线程绑定过程

《Linux下进程的CPU配置与线程绑定过程》本文介绍Linux系统中基于进程和线程的CPU配置方法,通过taskset命令和pthread库调整亲和力,将进程/线程绑定到特定CPU核心以优化资源分配... 目录1 基于进程的CPU配置1.1 对CPU亲和力的配置1.2 绑定进程到指定CPU核上运行2 基于

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

PostgreSQL的扩展dict_int应用案例解析

《PostgreSQL的扩展dict_int应用案例解析》dict_int扩展为PostgreSQL提供了专业的整数文本处理能力,特别适合需要精确处理数字内容的搜索场景,本文给大家介绍PostgreS... 目录PostgreSQL的扩展dict_int一、扩展概述二、核心功能三、安装与启用四、字典配置方法

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

Python get()函数用法案例详解

《Pythonget()函数用法案例详解》在Python中,get()是字典(dict)类型的内置方法,用于安全地获取字典中指定键对应的值,它的核心作用是避免因访问不存在的键而引发KeyError错... 目录简介基本语法一、用法二、案例:安全访问未知键三、案例:配置参数默认值简介python是一种高级编

MySQL中的索引结构和分类实战案例详解

《MySQL中的索引结构和分类实战案例详解》本文详解MySQL索引结构与分类,涵盖B树、B+树、哈希及全文索引,分析其原理与优劣势,并结合实战案例探讨创建、管理及优化技巧,助力提升查询性能,感兴趣的朋... 目录一、索引概述1.1 索引的定义与作用1.2 索引的基本原理二、索引结构详解2.1 B树索引2.2

从入门到精通MySQL 数据库索引(实战案例)

《从入门到精通MySQL数据库索引(实战案例)》索引是数据库的目录,提升查询速度,主要类型包括BTree、Hash、全文、空间索引,需根据场景选择,建议用于高频查询、关联字段、排序等,避免重复率高或... 目录一、索引是什么?能干嘛?核心作用:二、索引的 4 种主要类型(附通俗例子)1. BTree 索引(