Linux性能挖潜的隐藏招数:内核CPU亲和性参数调整

2023-11-06 03:08

本文主要是介绍Linux性能挖潜的隐藏招数:内核CPU亲和性参数调整,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者:李彬,赵雪枫,金融科技工程师,架构师社区特邀作者!

应用服务性能调优,是每个系统投产前都需要关注的问题,系统及软件层面的调优方法均有大量文章介绍,但在所有招数使出后,是否就无潜可挖了?如果了解Linux内核运行特征,经过简单的配置,仍存在不少可行的方案。本文将介绍的是基于Linux内核CPU亲和性参数调整,榨取最后一丝性能优势的方案。 

一、背景知识

CPU是常规应用运行计算的核心,从性能角度至少需要了解物理CPU、逻辑CPU和超线程技术实现。

1. 物理CPU:机器上实际安装的CPU个数。

2. 逻辑CPU:物理CPU会有多个逻辑运算核心,基于Intel的超线程技术(Hyper-Threading),可以在此基础上形成更多核心算力。

3. 超线程技术(Hyper-Threading):就是利用特殊的硬件指令,把一个CPU核模拟成多个逻辑CPU,形成多核多线程CPU。

综上所述,三者的逻辑关系如下:

逻辑CPU的数量=物理CPU的数量*CPU的核数*2(如果支持并开启了超线程的话)

 

二、CPU的亲和性参数原理

CPU的亲和性是一种调度属性,它可以将一个进程绑定到一个或者一组CPU上。CPU的亲和性分为两种:软亲和性和硬亲和性。

1)软CPU亲和性就是进程要在指定的CPU上尽量长时间地运行而不被迁移到其他处理器上运行。Linux内核的自身特性,意味着进程通常不会在处理器之间频繁迁移,以避免这种迁移对于计算能力的消耗,以达到最佳的平衡性。

2)Linux内核中还包含了一种硬CPU亲和性的机制,这个机制让开发人员可以实现硬CPU亲和性。这意味着可以显式指定进程在哪个(或哪些)处理器上运行。

在Linux内核中进程数据结构为task_struct,其中与亲和性相关的是cpus_allowed位掩码。这个位掩码由n位组成,与系统中的n个逻辑CPU一一对应。如果为给定的进程设置了给定的位,那么这个进程就可以在相关的CPU上运行了。

以32颗逻辑CPU服务器为例:

0x00000001 处理器0号逻辑CPU可运行
0x00000003 处理器0-1号逻辑CPU可迁移运行
0xFFFFFFFF 处理器0-31号逻辑CPU均可迁移运行(Linux内核缺省状态)
 

通常Linux内核都可以很好地对进程进行调度,在应该运行的地方运行进程,也就是说,在可用的处理器上运行并获得很好的整体性能。Linux内核中包含了一些用来检测CPU之间任务负载迁移的算法,可以启用进程迁移来降低繁忙的处理器的压力。

 

三、CPU的亲和性设置

Linux提供了一些方法,可以让用户通过修改位掩码来指定进程只能在某个(或者某些)CPU上运行。一般情况下,在应用程序中只需要使用缺省的调度器行为。然而,有时候我们可能会希望修改这些缺省行为以实现性能的优化。一般来说,我们要使用硬CPU亲和性有3个原因:有大量的计算要做;应用程序复杂;正在运行时间敏感的、决定性的进程。

经过对各种方式的总结,以下通过两个清晰的事例,对CPU亲和性的配置方式进行说明。

1)在应用源码中设置CPU亲和性

硬CPU亲和性的设置可以通过编程来实现,Linux内核提供了一些系统API,如:sched_set_affinity(),sched_get_affinity(),CPU_ZERO(),CPU_SET()等。一个简单设置硬CPU亲和性的例子如下:

#include <sched.h>

#include <unistd.h>

#include <stdlib.h>

#include <stdio.h>

 

int main(void)

{

int i, nrcpus;

cpu_set_t mask;

unsigned long bitmask = 0;

CPU_ZERO(&mask); //清空一个集合

CPU_SET(0, &mask); //将给定的CPU0加入集合

CPU_SET(2, &mask);//将给定的CPU2加入集合

if (sched_setaffinity(0,sizeof(cpu_set_t), &mask) == -1)

{

perror("sched_setaffinity");

exit(-1);

}

return 0;

}

 

2)通过命令方式设置CPU亲和性

硬CPU亲和性的设置还可以通过taskset命令来设置。taskset的命令格式是:

taskset [options] mask command [arg]…

taskset [options] –p[mask] pid

 

mask是CPU亲和性

command是可执行程序

arg是command的参数

pid是进程ID

 

第一个命令是用来设置可执行程序的硬CPU亲和性,第二个命令是用来设置已经运行的进程的硬CPU亲和性。

 

写在最后

最近在项目中,笔者碰到了系统CPU使用率不稳定的情况,分析了良久,才排查到是CPU亲和性相关的问题。在压力稳定,运算正常无外部瓶颈的情况下,形成一种无法解释的CPU剧烈波动。如下图所示:

如果后续碰到类似的问题,可以参考从调整CPU亲和性方面考虑,按图索骥,尝试调整该参数,看是否有奇效。

如有收获,点个在看,诚挚感谢

这篇关于Linux性能挖潜的隐藏招数:内核CPU亲和性参数调整的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/354130

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

linux-基础知识3

打包和压缩 zip 安装zip软件包 yum -y install zip unzip 压缩打包命令: zip -q -r -d -u 压缩包文件名 目录和文件名列表 -q:不显示命令执行过程-r:递归处理,打包各级子目录和文件-u:把文件增加/替换到压缩包中-d:从压缩包中删除指定的文件 解压:unzip 压缩包名 打包文件 把压缩包从服务器下载到本地 把压缩包上传到服务器(zip

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal