用linux perf命令来分析程序的cpu cache miss现象

2024-02-06 10:58

本文主要是介绍用linux perf命令来分析程序的cpu cache miss现象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

     先来看一段简单的程序:

#include <stdio.h>
#include <unistd.h>int main(int argc, char **argv)
{int a[1000][1000];if(1 == argc){for(int i = 0; i < 1000; ++i){for(int j = 0; j < 1000; ++j){a[i][j] = 0;}}}else{for(int i = 0; i < 1000; ++i){for(int j = 0; j < 1000; ++j){a[j][i] = 0;}}}return 0;
}

       上面有两个小程序片段, 哪段效率高? 显然, 第一段效率高, 为什么呢? 因为在C/C++中,数组是按行存储的,程序的按行访问可以充分利用程序的局部性原理(空间局部性), 用time命令来看看结果:

taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out 1real    0m0.009s
user    0m0.004s
sys     0m0.008s
taoge$ time ./a.out 1real    0m0.010s
user    0m0.004s
sys     0m0.004s
taoge$ time ./a.out 1real    0m0.010s
user    0m0.004s
sys     0m0.004s

        显然, 第二段程序的real time要大, 用perf分析下原因:

taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':101,870 L1-dcache-load-misses                                       0.005415735 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':100,231 L1-dcache-load-misses                                       0.005486385 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':103,496 L1-dcache-load-misses                                       0.005329914 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,122,333 L1-dcache-load-misses                                       0.012910445 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,093,971 L1-dcache-load-misses                                       0.009197791 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,099,561 L1-dcache-load-misses                                       0.009234823 seconds time elapsedtaoge$ 

       显而易见了,  cache miss太多了。

       理论联系实际地理解一下, 有好处。

 

 

 

 

这篇关于用linux perf命令来分析程序的cpu cache miss现象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/684090

相关文章

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Linux samba共享慢的原因及解决方案

《Linuxsamba共享慢的原因及解决方案》:本文主要介绍Linuxsamba共享慢的原因及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux samba共享慢原因及解决问题表现原因解决办法总结Linandroidux samba共享慢原因及解决

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版,这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日(3 月 27 日)放出了 Beta 版 Ubuntu 25.04 系统镜像,代号“Pluc

Linux安装MySQL的教程

《Linux安装MySQL的教程》:本文主要介绍Linux安装MySQL的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux安装mysql1.Mysql官网2.我的存放路径3.解压mysql文件到当前目录4.重命名一下5.创建mysql用户组和用户并修

Linux上设置Ollama服务配置(常用环境变量)

《Linux上设置Ollama服务配置(常用环境变量)》本文主要介绍了Linux上设置Ollama服务配置(常用环境变量),Ollama提供了多种环境变量供配置,如调试模式、模型目录等,下面就来介绍一... 目录在 linux 上设置环境变量配置 OllamPOgxSRJfa手动安装安装特定版本查看日志在

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

Linux系统之dns域名解析全过程

《Linux系统之dns域名解析全过程》:本文主要介绍Linux系统之dns域名解析全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、dns域名解析介绍1、DNS核心概念1.1 区域 zone1.2 记录 record二、DNS服务的配置1、正向解析的配置

Linux修改pip和conda缓存路径的几种方法

《Linux修改pip和conda缓存路径的几种方法》在Python生态中,pip和conda是两种常见的软件包管理工具,它们在安装、更新和卸载软件包时都会使用缓存来提高效率,适当地修改它们的缓存路径... 目录一、pip 和 conda 的缓存机制1. pip 的缓存机制默认缓存路径2. conda 的缓

Linux修改pip临时目录方法的详解

《Linux修改pip临时目录方法的详解》在Linux系统中,pip在安装Python包时会使用临时目录(TMPDIR),但默认的临时目录可能会受到存储空间不足或权限问题的影响,所以本文将详细介绍如何... 目录引言一、为什么要修改 pip 的临时目录?1. 解决存储空间不足的问题2. 解决权限问题3. 提

Linux中的进程间通信之匿名管道解读

《Linux中的进程间通信之匿名管道解读》:本文主要介绍Linux中的进程间通信之匿名管道解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、基本概念二、管道1、温故知新2、实现方式3、匿名管道(一)管道中的四种情况(二)管道的特性总结一、基本概念我们知道多