Golang学习系列1-pprof性能调优

2024-04-04 15:28

本文主要是介绍Golang学习系列1-pprof性能调优,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. pprof 简述 

一位亦师亦友的话让我记忆犹新,他说“学习一个新事务,应该从三个方面入手what,why,how;且三者的重要程度应该是递减”。所以在本文的第一部分先叙述下pprof的what & why。

1.1 What?

pprof是golang自身提供的一种性能分析可视化工具。pprof开启后,每隔一段时间(10ms)就会收集下当前的堆栈信息,获取各个函数占用的CPU以及内存资源,并通过采样数据的分析形成一个性能分析报告。性能分析报告的核心内容包括:

  • CPU Profiling:CPU 分析,按照一定的频率采集所监听的应用程序 CPU(含寄存器)的使用情况,可确定应用程序在主动消耗 CPU 周期时花费时间的位置
  • Memory Profiling:内存分析,在应用程序进行堆分配时记录堆栈跟踪,用于监视当前和历史内存使用情况,以及检查内存泄漏
  • Block Profiling:阻塞分析,记录 goroutine 阻塞等待同步(包括定时器通道)的位置
  • Mutex Profiling:互斥锁分析,报告互斥锁的竞争情况

1.2 Why?

基于以上的分析报告,开发人员可以快速分析,定位和优化性能问题。

2. 案例依赖环境配置

本文基于windows11操作系统完成配置。

  • Graph Visualization图可视化工具

官网描述:

Graph visualization is a way of representing structural information as diagrams of abstract graphs and networks. 

译文:

图可视化是一种将结构信息表示为抽象图和网络图的方法。

该工具在本文的作用体现在"案例分析"时对函数间调用关系以及各函数的CPU占用情况,以svg图形式进行可视化描述。

1)官网下载地址:https://www.graphviz.org/download/

2)安装&配置环境变量

  • 安装:除了"安装位置"自定义外,其余步骤按照默认值即可。

  •  环境变量配置

        在"控制面板"->"系统和安全"->"系统"->"高级系统设置"->"环境变量"->"系统变量"中完成设置

  • 验证是否安装配置成功

        Win+R 运行cmd窗口,输入命令'dot -version'查看,显示以下结果表示安装配置成功。

3. 案例分析

这部分就是在讲"How to do it?"的问题啦!

本实战基于Git开源项目"GitHub - wolfogre/go-pprof-practice: go pprof practice.",首先clone项目到本地,然后运行main.go.

3.1 pprof报告预览

在浏览器中访问:"http://localhost:6060/debug/pprof/",就可以看到pprof报告的预览页。

3.2 性能问题排查优化

以排查优化CPU占用问题为例进行描述。内存,协程,锁等问题除需要分析的指标不同外,其余排查优化步骤都与CPU相似,所以后面就不再赘述啦😁。

1)问题表现

        运行main.go后,查看任务管理器,发现该任务的CPU占用几乎为总CPU占用的50%。

2)问题分析

# 采集前10s的数据到文件中,然后进入pprof操作命令行界面
go tool pprof "http://localhost:6060/debug/pprof/profile?seconds=10"

输入'top'查看 CPU占用最多的程序,输出结果如下:

参数说明
参数描述
flat当前函数本身的执行耗时【等于0时:表示当前函数中只包含其他函数的调用
flat%flat占CPU总时间的比例
sum%上面每一行flat%的总和
cum

当前函数+调用其他函数的总耗时【等于flat时:表示函数中无其他函数调用

cum%cum占CPU总时间的比例

 由上图可见,函数"github.com/wolfogre/go-pprof-practice/animal/felidae/tiger.(*Tiger).Eat"的调用占用了几乎全部的CPU。使用'list Eat'命令查看具体函数的执行时间,以快速地定位到具体代码。

扩展:安装配置完成Graph Visualization可视化工具后,可使用'web'命令可对函数调用关系和资源使用情况进行svg可视化展示。

3)问题解决

通过上一步可定位到具体的问题代码,优化该代码逻辑即可。

注释掉耗时的代码后,再次查看任务管理器的资源消耗情况,可以看到已经完美解决Perfect!!!

func (t *Tiger) Eat() {log.Println(t.Name(), "eat")//注释掉耗时代码//loop := 10000000000//for i := 0; i < loop; i++ {//	// do nothing//}
}

4. 总结

最后,对程序性能问题的排查步骤核心指标做个简单小结。

核心指标

  

指标类型描述
profileCPU占用情况【eg: http://localhost:6060/debug/pprof/profile
heap内存占用情况【eg: http://localhost:6060/debug/pprof/heap
goroutine协程调度【eg: http://localhost:6060/debug/pprof/goroutine
mutex锁竞争情况【eg: http://localhost:6060/debug/pprof/mutex
block阻塞情况【eg: http://localhost:6060/debug/pprof/block

排查步骤

1. 采集数据&运行pprof分析工具

 go tool pprof "http://localhost:6060/debug/pprof/xxx?seconds=5"

2. 运行top指令

利用pprof提供的top指令查看指定指标的top函数。

3. 运行list xxx指令

利用pprof提供的list指令查看指定函数运行详情,定位问题,最后优化具体的代码即可。

参考文章:

pprof性能调优实战|青训营笔记

地鼠文档-pprof性能调优

这篇关于Golang学习系列1-pprof性能调优的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/876152

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]