使用ARM DS-5与Dstream StreamLine进行Android底层性能分析的一个实例

本文主要是介绍使用ARM DS-5与Dstream StreamLine进行Android底层性能分析的一个实例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

一个类似于Android的OS,只使用了BT机能的状态下,CPU的占有率超过20%,于是我们想看看是什么原因。本篇文章注意介绍了使用Dstream StreamLine来进行性能分析的过程和实例以及可能需要注意的地方。

StreamLine准备

使用StreamLine来分析性能主要包含以下几个过程

  1. 配置内核使得内核可以产生一些性能相关的数据,以及一些设施用以支持gator,例如:高精度的timer(hr_timer)
  2. 安装gator模块,用于系统性能数据(scheduler,event,Process)的采集以及对这些数据进行注释(annotate),例如对CP15中的PMNC(Performance Monitor Control Register)寄存器的读取与配置,对调度器数据的采集
  3. gatord从gator内核模块中获取性能数据,并通过网络(不一定是网线)传递给Host PC中的DS-5
  4. DS-5中的streamline对应软件模块对性能数据进行分析,以及与模块代码做出对应

对于前面的第一、第二步骤可以参考ARM官方的说明文档:ARM Streamline

编译与环境准备时候的注意点

如果使用的是adb 来让gatord传输数据到Host PC,那么需要将其中gator kernel module中的宏去掉(注释掉):

If you are building for an Android target, you must remove the comment hashtag from the following line in the makefile of the gator module to enable kernel stack unwinding

# EXTRA_CFLAGS += -DGATOR_KERNEL_STACK_UNWINDING

StreamLine数据采集与配置

gatord 端口号被占用问题

默认情况下,gatord使用的端口号为8080,但是在运行了许多应用程序的OS中,有可能这个端口号已经被占用了,如果被占用了,那么gatord在运行的时候,会出现如下的log提示,询问我们是否已经运行了一个gatord实例了:

Is an instance already running?

此时,我们可以使用ps 来查看一下是否已经存在运行的gatord,如果没有,那么可以看看这个端口号被谁使用了:

lsof  | grep 8080

如果没有lsof(android),那么可以使用netstat来查看:

 netstat -ltpn | grep 8080

另外也可以修改代码,打印出提示log对应的errno,在gator-daemon中的main.cpp中,添加errno的头文件,在bind IP地址失败后打印出errno来。

如果确实被占用了,那么我们需要更改这个端口号,可以直接对main.cpp中的端口号8080进行更改,也可以在运行gatord的时候,使用-p选项进行指定,例如将端口号指定为8888:

gatord -p 8888&

使用USB-ADB来连接Target与Host

如果没有网线,但是有adb(在android手机中,几乎都有),那么就可以使用adb

在PC中将远程gatord的端口号转发到本地的某个端口号,例如也是8888:

adb forward tcp:8888 tcp:8888

性能数据的采集

从DS-5 Eclipse中选择Window > Show View > Other > DS-5 > ARM Streamline Data
然后点击齿轮配置Capture。
StreamLine_CaptureSetting
因为已经使用adb将远程的gatord输出重定向了本地PC上的8888端口,所以在Address中填入localhost:8888。最后面的Program Images可以添加elf文件,从而可以加载symbols。添加elf image文件,也可以在采集完成后再添加。这里以采集完成后添加为例。
StreamLine_CaptureSetting_IP

添加少量的elf文件用于分析

在完成了Capture以后,可以添加elf文件,从而使各个进程都有symbols,点击下图中的齿轮,进入配置页面。
DstreamLine_AddElf_Symbols

Figure: Setting

在弹出的设置对话框中,在Program Images中可以添加elf文件,但是这里只能一个个的添加,无法大量按照特殊要求添加(例如只添加libQt***):

StreamLine_ELF_ADD_OneByOne

Figure: Add_ELF_Files

添加大量的elf文件用于分析

如果要添加大量的elf文件,或者要按照我们特别的需求来添加大量的elf文件,那么就需要其他方法。

从前面的Figure: Setting图中,方框标明了这个Capture文件的位置:

/home/hexiongjun/Documents/Streamline/Test.apc/ , 其中添加了的elf文件记录在session.xml文件中。
打开这个Capture session的session.xml,添加所有的so和vmlinux文件路径,例如添加了几个的样子:
<?xml version="1.0" encoding="UTF-8"?>
<session version="1" output_path="x" call_stack_unwinding="yes" parse_debug_info="yes" high_resolution="no" buffer_mode="streaming" sample_rate="normal" duration="0" target_type="ARM - Streamline Agent" target_address="localhost:8888" live_rate="100">
<image path="${streamline_results}/Test.apc/vmlinux"/>
<image path="${streamline_results}/Test.apc/app.so"/>
<image path="${streamline_results}/Test.apc/ld-linux.so.3"/>
<image path="${streamline_results}/Test.apc/libc.so.6"/>
<image path="${streamline_results}/Test.apc/libQtGui.so"/>
<image path="${streamline_results}/Test.apc/libQtCore.so"/>
<image path="/home/hexiongjun/work/obj/SHARED_LIBRARIES/libpthread.so.0_intermediates/LINKED/libpthread.so.0"/>
<energy_capture version="1" type="none">
<channel id="0" resistance="20" power="yes"/>
</energy_capture>
</session>
session.xml (END)

注意红色字体的部分,就是添加了的几个文件。同时注意这些elf文件的路径位置,它们被拷贝到了/home/hexiongjun/Documents/Streamline/Test.apc/中。

因此,现在问题就转换成了在session.xml文件中按照格式添加文件列表了。对于需要添加的的文件我们假设有两种:

  1. 添加所有elf的文件:内核+OS+App
  2. 只添加符号某一类条件的文件:例如libQt***
添加所有elf的文件

为了表示最极端的情况,这里假设需要将所有的OS相关elf文件、以及APP elf文件都添加进来。那么其实就是:

  • kernel相关:vmlinux + kernel modules(ko)
  • Application相关:可执行的应用程序,应用程序依赖的shared objects,以及so依赖的so

对于前者,直接添加即可,如果kernel module比较多,那么可以直接在kernel module_install中find一把,然后重定向到一个文件中,即可得到所有的ko文件路径列表。

对于后者,需要根据实际情况来处理,如果是Android环境下,那么所有的没有strip过的elf文件都放在:

out/target/$TARGETPRODUCT/symbols

$OUT/symbols

然后,使用find命令以及realpath命令来获取这些文件路径,然后拷贝到session.xml中,并使用编译器或者sed/awk,让这些文件列表符合xml语言语法接口,例如在VIM中可以使用下面命令来添加每行的结束字符串"/>:

:%s/$/\"\/\>
只添加符号某一类条件的文件

要包含某一类的lib,可以使用realpath:

realpath all_libs/libQt* >> ../list.txt
realpath all_libs/libqt* >> ../list.txt

StreamLine采集数据的分析

在添加好elf image文件之后,就可以双击采集好的session来进行分析了,但是如果添加的文件比较多,有可能会出现如下的提示:

java heap space

对于此问题,可以参考我在ARM社区的提问:How to solve the Java heap space when streamline analyse the capture?

分析完成后,可以在Timeline标签中看到各个Process的CPU占有率。如下图中,bt线程使用了21.3%的CPU:

StreamLineProcessorCPU

然后我们需要找到都是那些函数占用的CPU,切换到Call Paths标签可以看到:

StreamLineProcessorCPU_Function

出于隐私等因素,对函数和线程名称进行了模糊处理,但是CPU主要用于了串口通讯。然后根据我们的代码和对串口的使用方法知道我们没有使用DMA来传输数据,而BT本身有大量的数据产生。因此修改代码使用DMA来传输数据,然后对比CPU的占用率,就知道是否是这里的问题了。


参考

捕鱼达人用的游戏引擎cocos2d-x使用StreamLine的优化实例

Streamline profiler: Revealing reality

Software Optimization: Four real-life Streamline use cases


如果文章有格式问题,请移步:http://www.hexiongjun.com/?p=187

转载请注明出处。作者:TonyHo hexiongjun.com 

这篇关于使用ARM DS-5与Dstream StreamLine进行Android底层性能分析的一个实例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773174

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo