C++分析程序各模块耗时-perf火焰图

2024-04-07 22:04

本文主要是介绍C++分析程序各模块耗时-perf火焰图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

C++分析程序各模块耗时-perf火焰图

  • 1. 简介
  • 2. 安装
  • 3. 测试示例
  • 4. 从火焰图可以获得的信息
  • 5. 生成火焰图常见问题

Reference:

  1. Perf Wiki
  2. 【性能】perf + 火焰图分析软件性能瓶颈
  3. 【火焰图🔥】Linux C/C++性能优化分析工具Perf使用教程

perf: Linux profiling with performance counters(带有性能计数器的Linux分析)

1. 简介

perf 是一个非常实用且深入的性能分析工具,适用于从底层硬件交互到上层应用程序逻辑的全方位性能剖析。

perf 工具的设计目的是为了帮助开发者和系统管理员分析应用程序以及内核本身的性能,寻找潜在的性能瓶颈,并据此进行针对性的优化。

2. 安装

sudo apt install linux-tools-common
// 下面步骤根据 Linux 内核来。比如查看 uname -a 得到内核版本,根据相应版本修改下面指令
sudo apt install linux-tools-5.15.0-101-generic

  • 查看 perf 版本

    perf --version

3. 测试示例

#include <stdio.h>
#include <stdlib.h>void long_test() {int i, j;for (i = 0; i < 1000000; i++) j = i;
}void foo2() {int i;for (i = 0; i < 10; i++) long_test();
}void foo1() {int i;for (i = 0; i < 100; i++) long_test();
}
int main(void) {foo1();foo2();
}
  1. 编译成二进制文件

    g++ -o test test.cpp

  2. 使用 perf 对系统 CPU 事件做采样
    采样60s,会生成一个perf.data文件(采样时间可自行设定):

    #方式一:对一个正在运行的进程,进行采样
    perf record -p PID[这里换成要检测的进程ID] -g – sleep 60
    #方式二:全新运行一个二进制文件main,进行采样
    sudo perf record -F 99 -g ./test – sleep 60

  3. 安装火焰图
    利用这个开源工具可以将报告生成可视化的svg图片,更容易查看对应的CPU开销时间和调用栈深度:

    git clone --depth 1 https://github.com/brendangregg/FlameGraph.git
    #安装perl
    yum install -y perl

  4. 生成火焰图
    生成火焰图的脚本,对二进制文件main进行10秒的采样,然后生成火焰图。
    非root用户需要加sudo。

    perf record -g ./test sleep 10
    perf script -i perf.data &> perf.unfold
    #火焰图的两个功能
    ./FlameGraph/stackcollapse-perf.pl perf.unfold &> perf.folded
    ./FlameGraph/flamegraph.pl perf.folded > perf.svg

我自己的:

sudo perf record -g ./build_pc/dead_reckoning sleep 10
perf script -i perf.data &> perf.unfold
/home/yj/sda/third_party/FlameGraph/stackcollapse-perf.pl perf.unfold &> perf.folded
/home/yj/sda/third_party/FlameGraph/flamegraph.pl perf.folded > perf.svg
在这里插入图片描述

上面的方式中,[unknown] 出现过多,可考虑将 -g(默认为 fp) 修改为 --call-graph。可参考 使用 perf 进行性能分析时如何获取准确的调用栈

-优点缺点
fpNone默认 fp 被优化掉了根本不可用。
lbr高效准确需要较新的 Intel CPU 才有此功能;2. 能记录的调用栈深度有限。
dwarf准确1. 开销相对较大;2. 需要编译时附加了调试信息。

sudo perf record --call-graph dwarf ./build_pc/dead_reckoning sleep 10
sudo perf script -i perf.data &> perf.unfold
/home/yj/sda/third_party/FlameGraph/stackcollapse-perf.pl perf.unfold &> perf.folded
/home/yj/sda/third_party/FlameGraph/flamegraph.pl perf.folded > perf.svg
在这里插入图片描述

4. 从火焰图可以获得的信息

  • 调用栈从下往上,下层为父类,上层为子类。
  • 点击父类缩小,点击子类放大。
  • 只关注自己实现的函数名,忽略标准库中的函数
  • 总结一下,火焰图的宽度用于比较不同函数或代码路径的性能,而高度用于显示函数调用堆栈的深度

5. 生成火焰图常见问题

  1. Stack count is low (1). Did something go wrong?
    -> sudo perf script 时没加 root 权限。

这篇关于C++分析程序各模块耗时-perf火焰图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/883792

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

【C++ Primer Plus习题】13.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream>#include "port.h"int main() {Port p1;Port p2("Abc", "Bcc", 30);std::cout <<

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

C++包装器

包装器 在 C++ 中,“包装器”通常指的是一种设计模式或编程技巧,用于封装其他代码或对象,使其更易于使用、管理或扩展。包装器的概念在编程中非常普遍,可以用于函数、类、库等多个方面。下面是几个常见的 “包装器” 类型: 1. 函数包装器 函数包装器用于封装一个或多个函数,使其接口更统一或更便于调用。例如,std::function 是一个通用的函数包装器,它可以存储任意可调用对象(函数、函数

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

06 C++Lambda表达式

lambda表达式的定义 没有显式模版形参的lambda表达式 [捕获] 前属性 (形参列表) 说明符 异常 后属性 尾随类型 约束 {函数体} 有显式模版形参的lambda表达式 [捕获] <模版形参> 模版约束 前属性 (形参列表) 说明符 异常 后属性 尾随类型 约束 {函数体} 含义 捕获:包含零个或者多个捕获符的逗号分隔列表 模板形参:用于泛型lambda提供个模板形参的名

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

【C++高阶】C++类型转换全攻略:深入理解并高效应用

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C++ “ 登神长阶 ” 🤡往期回顾🤡:C++ 智能指针 🌹🌹期待您的关注 🌹🌹 ❀C++的类型转换 📒1. C语言中的类型转换📚2. C++强制类型转换⛰️static_cast🌞reinterpret_cast⭐const_cast🍁dynamic_cast 📜3. C++强制类型转换的原因📝

C++——stack、queue的实现及deque的介绍

目录 1.stack与queue的实现 1.1stack的实现  1.2 queue的实现 2.重温vector、list、stack、queue的介绍 2.1 STL标准库中stack和queue的底层结构  3.deque的简单介绍 3.1为什么选择deque作为stack和queue的底层默认容器  3.2 STL中对stack与queue的模拟实现 ①stack模拟实现