干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)

2024-03-09 06:32

本文主要是介绍干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

今年春招的时候,那是一个春意盎然的下午,我正在进行一场没有硝烟的战争——面试。我特别清楚地记得,那天是我接种新冠疫苗后的第二天,脑子晕乎乎的,感觉自己没有开机,所以面试过程中回答得不尽人意。(但是面试官真的人很好哈哈哈)

img

鲁迅先生说过:“真正的勇士,敢于直面惨淡的人生”,而我需要敢于直面糟糕的面试

面试结束后,我就赶紧将面试过程中问到的问题记录了下来,并打算做一个复盘

img

其中,让我印象最深的便是“你跟我说说什么是平均负载以及什么是CPU使用率,它们之间有什么关系吗

平均负载

我们先来说说什么是平均负载

我们在终端输入 top 命令或者 uptime 命令,就能显示出系统过去1 分钟、5 分钟、15 分钟的平均负载(如图所示,红框部分)

img

  • 平均负载是指单位时间内,处在可执行状态和不可中断睡眠状态的进程的平均数。也就是说,它包括了处在执行态,阻塞态和就绪态的进程。

可能有小伙伴会问,什么是可执行状态的进程和不可中断睡眠状态的进程?

其中,**可执行状态的进程包括正在被CPU执行的进程以及在就绪队列上等待CPU执行的进程,**也就是我们常用 ps 命令看到的,处于 R 状态(Running 或 Runnable)的进程(也就是进程的三个基本状态中的执行态和就绪态)

而不可中断睡眠状态的进程即指处于内核关键流程中的进程,并且这些流程不可被打断。比如最常见的就是等待硬件设备的I/O响应。也就是我们在 ps 命令中看到的 D 状态(Uninterruptible Sleep,也称为 Disk Sleep)的进程(也就是进程的三个基本状态中的阻塞态)。

介绍完了什么是平均负载后,可能有小伙伴又会问:怎么判断系统的负载情况是否过大过小呢?

这里我举一个简单的例子

假设系统上有两个CPU:如果负载为1,那么意味着CPU有百分之50的空闲如果负载为2,那么意味着所有的CPU都刚好被完全占用如果负载为4,那么意味着有超过一半的进程竞争不到CPU

如何判断系统的平均负载是否合理?

  • 如果 1 分钟、5 分钟、15 分钟的三个值基本相同,或者相差不大,那就说明系统负载很平稳。
  • 但如果 1 分钟的值远小于 15 分钟的值,就说明系统最近 1 分钟的负载在减少,而过去 15 分钟内却有很大的负载,即系统的负载在逐渐减少。
  • 反过来,如果 1 分钟的值远大于 15 分钟的值,就说明最近 1 分钟的负载在增加,这种增加有可能只是临时性的,也有可能还会持续增加下去,所以就需要持续观察。一旦 1 分钟的平均负载接近或超过了 CPU 的个数,就意味着系统正在发生过载的问题,这时就得分析调查是哪里导致的问题,并要想办法优化了。
  • 在实际生产环境中,当平均负载高于 CPU 数量 70% 的时候,我们就应该分析排查负载高的问题了。一旦负载过高,就可能导致进程响应变慢,进而影响服务的正常功能

这里我再举个简单的例子:

假设我们在一个只有一个CPU的系统上看到平均负载为:1.73,0.60,7.98。那么说明在过去1分钟内,系统有73%的超载,在过去15分钟内,系统更是达到了698%的超载,但就整体趋势来看,系统的负载是逐渐降低的。

CPU使用率

讲完平均负载,我们再来了解一下CPU使用率。

CPU使用率是指在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

比如说:比如说单核CPU一秒内处在非空闲态的时间为0.6秒,那么它的CPU使用率就是60%而双核CPU一秒内处在非空闲态的时间分别为0.6s和0.4s,那么它的CPU使用率为(0.4+0.6)/ 2 * 100% = 50%

看到这里,想必大家都对这两个概念有一个大体上的了解了吧

总的来说,系统负载或者说系统的平均负载,它的参考标准是进程数;而CPU使用率的参考标准是CPU的忙碌时

俗话说:“NO PICTURE NO BB ”,为了让大家更直观的感受这两个概念的区别,我将会配合着图再讲解一个例子:

有一家银行,他只有一个业务窗口,每次只能接待一个人(单核CPU)。有一天一共有五个人来了,那么就会出现一人在办理手续,其余四人在等待的情况(CPU负载为5)我们约定在业务窗口的那个人只有真正在办理业务才算是真正使用这个窗口,才算意味着窗口在忙碌(CPU使用率)

在这里插入图片描述

平均负载和CPU使用率的关系

在介绍完了这两个概念之后,真正的重点内容才刚刚开始

前面我们说到,面试官的最后一个问题就是:平均负载和CPU使用率的关系

也就是说CPU使用率的升高与下降跟平均负载的增大与减小有没有什么关系,我将通过下面这个案例来跟大家讲解一下。

CPU使用率高的情况

案例开始前,我先简单说明一下本次案例的虚拟机的配置

  • 内存1GB
  • 一个CPU
  • 版本:CentOS 7.6

首先下载相关工具包

其中 sysstat 工具是用来查看系统的整体性能情况的,例如CPU使用率和平均负载这些指标,而 stress 则是一个压力测试工具,用来模拟出各种性能压力

# 下载相关工具包yum install -y sysstat stress

之后我们使用 stress 工具来模拟CPU使用率为100%

#--timeout 600:持续时间为600s
stress --cpu 1 --timeout 600

接着等待一段时间,我们来看一下系统的平均负载情况

uptime... load average: 1.11, 0.59, 0.29

可以看到,在单核CPU系统里,过去的时间里的平均负载是在逐渐上升的,而过去1分钟内的平均负载甚至达到了1.11,这说明CPU已经被完全占满。

我们使用 sysstat 工具包中的 mpstat 查看 cpu 性能情况

mpstat -P ALL 5

在这里插入图片描述

这里我们可以看到,用户态CPU使用率已经达到了100%

总结:CPU使用率的升高会导致系统平均负载的上升

除此之外:

  • 系统内出现大量等待I/O的进程(系统I/O压力大)的时候也会导致平均负载升高,但是CPU使用率不一点升高
  • 系统内出现大量的进程,进程数远远超过了CPU数量的情况下也会导致平均负载的升高和CPU使用率的升高

总结

我们来回顾一下今天所学的内容:

  • 系统负载:指处在可执行状态和不可中断状态的进程的总数

    • 可执行状态的进程:表示正在被CPU执行的和在就绪队列中等待被CPU执行的进程
    • 不可中断状态进程:表示当前该进程正在等待某种事件的响应,并且这个状态是不可被打断的,比较常见的有跟硬件交互的时候、等待硬件I/O
  • 系统平均负载:单位时间内处在可执行状态和不可中断状态的进程的平均数

  • CPU使用率:表示在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

  • CPU使用率升高会导致系统平均负载的升高

在这里插入图片描述

这篇关于干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/789798

相关文章

Spring Cloud LoadBalancer 负载均衡详解

《SpringCloudLoadBalancer负载均衡详解》本文介绍了如何在SpringCloud中使用SpringCloudLoadBalancer实现客户端负载均衡,并详细讲解了轮询策略和... 目录1. 在 idea 上运行多个服务2. 问题引入3. 负载均衡4. Spring Cloud Load

使用Navicat工具比对两个数据库所有表结构的差异案例详解

《使用Navicat工具比对两个数据库所有表结构的差异案例详解》:本文主要介绍如何使用Navicat工具对比两个数据库test_old和test_new,并生成相应的DDLSQL语句,以便将te... 目录概要案例一、如图两个数据库test_old和test_new进行比较:二、开始比较总结概要公司存在多

MySQL的cpu使用率100%的问题排查流程

《MySQL的cpu使用率100%的问题排查流程》线上mysql服务器经常性出现cpu使用率100%的告警,因此本文整理一下排查该问题的常规流程,文中通过代码示例讲解的非常详细,对大家的学习或工作有一... 目录1. 确认CPU占用来源2. 实时分析mysql活动3. 分析慢查询与执行计划4. 检查索引与表

SpringBoot实现动态插拔的AOP的完整案例

《SpringBoot实现动态插拔的AOP的完整案例》在现代软件开发中,面向切面编程(AOP)是一种非常重要的技术,能够有效实现日志记录、安全控制、性能监控等横切关注点的分离,在传统的AOP实现中,切... 目录引言一、AOP 概述1.1 什么是 AOP1.2 AOP 的典型应用场景1.3 为什么需要动态插

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

MySQL不使用子查询的原因及优化案例

《MySQL不使用子查询的原因及优化案例》对于mysql,不推荐使用子查询,效率太差,执行子查询时,MYSQL需要创建临时表,查询完毕后再删除这些临时表,所以,子查询的速度会受到一定的影响,本文给大家... 目录不推荐使用子查询和JOIN的原因解决方案优化案例案例1:查询所有有库存的商品信息案例2:使用EX

使用Python检查CPU型号并弹出警告信息

《使用Python检查CPU型号并弹出警告信息》本教程将指导你如何编写一个Python程序,该程序能够在启动时检查计算机的CPU型号,如果检测到CPU型号包含“I3”,则会弹出一个警告窗口,感兴趣的小... 目录教程目标方法一所需库步骤一:安装所需库步骤二:编写python程序步骤三:运行程序注意事项方法二

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于