用linux perf命令来分析程序的cpu cache miss现象

2024-02-06 10:58

本文主要是介绍用linux perf命令来分析程序的cpu cache miss现象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

     先来看一段简单的程序:

#include <stdio.h>
#include <unistd.h>int main(int argc, char **argv)
{int a[1000][1000];if(1 == argc){for(int i = 0; i < 1000; ++i){for(int j = 0; j < 1000; ++j){a[i][j] = 0;}}}else{for(int i = 0; i < 1000; ++i){for(int j = 0; j < 1000; ++j){a[j][i] = 0;}}}return 0;
}

       上面有两个小程序片段, 哪段效率高? 显然, 第一段效率高, 为什么呢? 因为在C/C++中,数组是按行存储的,程序的按行访问可以充分利用程序的局部性原理(空间局部性), 用time命令来看看结果:

taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out 1real    0m0.009s
user    0m0.004s
sys     0m0.008s
taoge$ time ./a.out 1real    0m0.010s
user    0m0.004s
sys     0m0.004s
taoge$ time ./a.out 1real    0m0.010s
user    0m0.004s
sys     0m0.004s

        显然, 第二段程序的real time要大, 用perf分析下原因:

taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':101,870 L1-dcache-load-misses                                       0.005415735 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':100,231 L1-dcache-load-misses                                       0.005486385 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':103,496 L1-dcache-load-misses                                       0.005329914 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,122,333 L1-dcache-load-misses                                       0.012910445 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,093,971 L1-dcache-load-misses                                       0.009197791 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,099,561 L1-dcache-load-misses                                       0.009234823 seconds time elapsedtaoge$ 

       显而易见了,  cache miss太多了。

       理论联系实际地理解一下, 有好处。

 

 

 

 

这篇关于用linux perf命令来分析程序的cpu cache miss现象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/684090

相关文章

Linux命令之firewalld的用法

《Linux命令之firewalld的用法》:本文主要介绍Linux命令之firewalld的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux命令之firewalld1、程序包2、启动firewalld3、配置文件4、firewalld规则定义的九大

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、

Linux ls命令操作详解

《Linuxls命令操作详解》通过ls命令,我们可以查看指定目录下的文件和子目录,并结合不同的选项获取详细的文件信息,如权限、大小、修改时间等,:本文主要介绍Linuxls命令详解,需要的朋友可... 目录1. 命令简介2. 命令的基本语法和用法2.1 语法格式2.2 使用示例2.2.1 列出当前目录下的文

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》:本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小

Linux中的计划任务(crontab)使用方式

《Linux中的计划任务(crontab)使用方式》:本文主要介绍Linux中的计划任务(crontab)使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、前言1、linux的起源与发展2、什么是计划任务(crontab)二、crontab基础1、cro

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子