干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)

2024-03-09 06:32

本文主要是介绍干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

今年春招的时候,那是一个春意盎然的下午,我正在进行一场没有硝烟的战争——面试。我特别清楚地记得,那天是我接种新冠疫苗后的第二天,脑子晕乎乎的,感觉自己没有开机,所以面试过程中回答得不尽人意。(但是面试官真的人很好哈哈哈)

img

鲁迅先生说过:“真正的勇士,敢于直面惨淡的人生”,而我需要敢于直面糟糕的面试

面试结束后,我就赶紧将面试过程中问到的问题记录了下来,并打算做一个复盘

img

其中,让我印象最深的便是“你跟我说说什么是平均负载以及什么是CPU使用率,它们之间有什么关系吗

平均负载

我们先来说说什么是平均负载

我们在终端输入 top 命令或者 uptime 命令,就能显示出系统过去1 分钟、5 分钟、15 分钟的平均负载(如图所示,红框部分)

img

  • 平均负载是指单位时间内,处在可执行状态和不可中断睡眠状态的进程的平均数。也就是说,它包括了处在执行态,阻塞态和就绪态的进程。

可能有小伙伴会问,什么是可执行状态的进程和不可中断睡眠状态的进程?

其中,**可执行状态的进程包括正在被CPU执行的进程以及在就绪队列上等待CPU执行的进程,**也就是我们常用 ps 命令看到的,处于 R 状态(Running 或 Runnable)的进程(也就是进程的三个基本状态中的执行态和就绪态)

而不可中断睡眠状态的进程即指处于内核关键流程中的进程,并且这些流程不可被打断。比如最常见的就是等待硬件设备的I/O响应。也就是我们在 ps 命令中看到的 D 状态(Uninterruptible Sleep,也称为 Disk Sleep)的进程(也就是进程的三个基本状态中的阻塞态)。

介绍完了什么是平均负载后,可能有小伙伴又会问:怎么判断系统的负载情况是否过大过小呢?

这里我举一个简单的例子

假设系统上有两个CPU:如果负载为1,那么意味着CPU有百分之50的空闲如果负载为2,那么意味着所有的CPU都刚好被完全占用如果负载为4,那么意味着有超过一半的进程竞争不到CPU

如何判断系统的平均负载是否合理?

  • 如果 1 分钟、5 分钟、15 分钟的三个值基本相同,或者相差不大,那就说明系统负载很平稳。
  • 但如果 1 分钟的值远小于 15 分钟的值,就说明系统最近 1 分钟的负载在减少,而过去 15 分钟内却有很大的负载,即系统的负载在逐渐减少。
  • 反过来,如果 1 分钟的值远大于 15 分钟的值,就说明最近 1 分钟的负载在增加,这种增加有可能只是临时性的,也有可能还会持续增加下去,所以就需要持续观察。一旦 1 分钟的平均负载接近或超过了 CPU 的个数,就意味着系统正在发生过载的问题,这时就得分析调查是哪里导致的问题,并要想办法优化了。
  • 在实际生产环境中,当平均负载高于 CPU 数量 70% 的时候,我们就应该分析排查负载高的问题了。一旦负载过高,就可能导致进程响应变慢,进而影响服务的正常功能

这里我再举个简单的例子:

假设我们在一个只有一个CPU的系统上看到平均负载为:1.73,0.60,7.98。那么说明在过去1分钟内,系统有73%的超载,在过去15分钟内,系统更是达到了698%的超载,但就整体趋势来看,系统的负载是逐渐降低的。

CPU使用率

讲完平均负载,我们再来了解一下CPU使用率。

CPU使用率是指在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

比如说:比如说单核CPU一秒内处在非空闲态的时间为0.6秒,那么它的CPU使用率就是60%而双核CPU一秒内处在非空闲态的时间分别为0.6s和0.4s,那么它的CPU使用率为(0.4+0.6)/ 2 * 100% = 50%

看到这里,想必大家都对这两个概念有一个大体上的了解了吧

总的来说,系统负载或者说系统的平均负载,它的参考标准是进程数;而CPU使用率的参考标准是CPU的忙碌时

俗话说:“NO PICTURE NO BB ”,为了让大家更直观的感受这两个概念的区别,我将会配合着图再讲解一个例子:

有一家银行,他只有一个业务窗口,每次只能接待一个人(单核CPU)。有一天一共有五个人来了,那么就会出现一人在办理手续,其余四人在等待的情况(CPU负载为5)我们约定在业务窗口的那个人只有真正在办理业务才算是真正使用这个窗口,才算意味着窗口在忙碌(CPU使用率)

在这里插入图片描述

平均负载和CPU使用率的关系

在介绍完了这两个概念之后,真正的重点内容才刚刚开始

前面我们说到,面试官的最后一个问题就是:平均负载和CPU使用率的关系

也就是说CPU使用率的升高与下降跟平均负载的增大与减小有没有什么关系,我将通过下面这个案例来跟大家讲解一下。

CPU使用率高的情况

案例开始前,我先简单说明一下本次案例的虚拟机的配置

  • 内存1GB
  • 一个CPU
  • 版本:CentOS 7.6

首先下载相关工具包

其中 sysstat 工具是用来查看系统的整体性能情况的,例如CPU使用率和平均负载这些指标,而 stress 则是一个压力测试工具,用来模拟出各种性能压力

# 下载相关工具包yum install -y sysstat stress

之后我们使用 stress 工具来模拟CPU使用率为100%

#--timeout 600:持续时间为600s
stress --cpu 1 --timeout 600

接着等待一段时间,我们来看一下系统的平均负载情况

uptime... load average: 1.11, 0.59, 0.29

可以看到,在单核CPU系统里,过去的时间里的平均负载是在逐渐上升的,而过去1分钟内的平均负载甚至达到了1.11,这说明CPU已经被完全占满。

我们使用 sysstat 工具包中的 mpstat 查看 cpu 性能情况

mpstat -P ALL 5

在这里插入图片描述

这里我们可以看到,用户态CPU使用率已经达到了100%

总结:CPU使用率的升高会导致系统平均负载的上升

除此之外:

  • 系统内出现大量等待I/O的进程(系统I/O压力大)的时候也会导致平均负载升高,但是CPU使用率不一点升高
  • 系统内出现大量的进程,进程数远远超过了CPU数量的情况下也会导致平均负载的升高和CPU使用率的升高

总结

我们来回顾一下今天所学的内容:

  • 系统负载:指处在可执行状态和不可中断状态的进程的总数

    • 可执行状态的进程:表示正在被CPU执行的和在就绪队列中等待被CPU执行的进程
    • 不可中断状态进程:表示当前该进程正在等待某种事件的响应,并且这个状态是不可被打断的,比较常见的有跟硬件交互的时候、等待硬件I/O
  • 系统平均负载:单位时间内处在可执行状态和不可中断状态的进程的平均数

  • CPU使用率:表示在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

  • CPU使用率升高会导致系统平均负载的升高

在这里插入图片描述

这篇关于干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/789798

相关文章

使用Python检查CPU型号并弹出警告信息

《使用Python检查CPU型号并弹出警告信息》本教程将指导你如何编写一个Python程序,该程序能够在启动时检查计算机的CPU型号,如果检测到CPU型号包含“I3”,则会弹出一个警告窗口,感兴趣的小... 目录教程目标方法一所需库步骤一:安装所需库步骤二:编写python程序步骤三:运行程序注意事项方法二

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。

STL经典案例(四)——实验室预约综合管理系统(项目涉及知识点很全面,内容有点多,耐心看完会有收获的!)

项目干货满满,内容有点过多,看起来可能会有点卡。系统提示读完超过俩小时,建议分多篇发布,我觉得分篇就不完整了,失去了这个项目的灵魂 一、需求分析 高校实验室预约管理系统包括三种不同身份:管理员、实验室教师、学生 管理员:给学生和实验室教师创建账号并分发 实验室教师:审核学生的预约申请 学生:申请使用实验室 高校实验室包括:超景深实验室(可容纳10人)、大数据实验室(可容纳20人)、物联网实验

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

【干货分享】基于SSM的体育场管理系统的开题报告(附源码下载地址)

中秋送好礼 中秋佳节将至,祝福大家中秋快乐,阖家幸福。本期免费分享毕业设计作品:《基于SSM的体育场管理系统》。 基于SSM的体育场管理系统的开题报告 一、课题背景与意义 随着全民健身理念的深入人心,体育场已成为广大师生和社区居民进行体育锻炼的重要场所。然而,传统的体育场管理方式存在诸多问题,如资源分配不均、预约流程繁琐、数据统计不准确等,严重影响了体育场的使用效率和用户体验。