通过profiler对unity进行针对性优化

2024-06-19 19:48

本文主要是介绍通过profiler对unity进行针对性优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. CPU Usage

    A. WaitForTargetFPS:

       Vsync(垂直同步)功能所,即显示当前帧的CPU等待时间

    B. Overhead:

       Profiler总体时间-所有单项的记录时间总和。用于记录尚不明确的时间消耗,以帮助进一步完善Profiler的统计。

         C. Physics.Simulate:

       当前帧物理模拟的CPU占用时间。

    D. Camera.Render:

       相机渲染准备工作的CPU占用量

    E. RenderTexture.SetActive:

       设置RenderTexture操作.

       底层实现:1.比对当前帧与前一帧的ColorSurface和DepthSurface.

                2.如果这两个Buffer一致则不生成新的RT,否则则生成新的RT,并设置与之相对应的Viewport和空间转换矩阵.

    F. Monobehaviour.OnMouse_ :

       用于检测鼠标的输入消息接收和反馈,主要包括:SendMouseEvents和DoSendMouseEvents。(只要Edtor开起来,这个就会存在)

    G. HandleUtility.SetViewInfo:

       仅用于Editor中,作用是将GUI和Editor中的显示看起来与发布版本的显示一致。

H. GUI.Repaint:

       GUI的重绘(说明在有使用原生的OnGUI)

    I. Event.Internal_MakeMasterEventCurrent:

       负责GUI的消息传送

    J. Cleanup Unused Cached Data:

       清空无用的缓存数据,主要包括RenderBuffer的垃圾回收和TextRendering的垃圾回收。

          1.RenderTexture.GarbageCollectTemporary:存在于RenderBuffer的垃圾回收中,清除临时的FreeTexture.

          2.TextRendering.Cleanup:TextMesh的垃圾回收操作

    K. Application.Integrate Assets in Background

       遍历预加载的线程队列并完成加载,同时,完成纹理的加载、Substance的Update等.

    L. Application.LoadLevelAsync Integrate:

       加载场景的CPU占用,通常如果此项时间长的话70%的可能是Texture过长导致.

    M. UnloadScene:

       卸载场景中的GameObjects、Component和GameManager,一般用在切换场景时.

    N. CollectGameObjectObjects:

       执行上面M项的同时,会将场景中的GameObject和Component聚集到一个Array中.然后执行下面的Destroy.

    O. Destroy:

       删除GameObject和Component的CPU占用.

    P. AssetBundle.LoadAsync Integrate:

       多线程加载AwakeQueue中的内容,即多线程执行资源的AwakeFromLoad函数.

    Q. Loading.AwakeFromLoad:

       在资源被加载后调用,对每种资源进行与其对应用处理.

 


2. CPU Usage

    A. Device.Present:

       device.PresentFrame的耗时显示,该选项出现在发布版本中.

    B. Graphics.PresentAndSync:

       GPU上的显示和垂直同步耗时.该选项出现在发布版本中.

    C. Mesh.DrawVBO:

       GPU中关于Mesh的Vertex Buffer Object的渲染耗时.

    D. Shader.Parse:

       资源加入后引擎对Shader的解析过程.

    E. Shader.CreateGPUProgram:

       根据当前设备支持的图形库来建立GPU工程.

3. Memory Profiler

 

    A. Used Total:

       当前帧的Unity内存、Mono内存、GfxDriver内存、Profiler内存的总和.

    B. Reserved Total:

       系统在当前帧的申请内存.

    C. Total System Memory Usage:

       当前帧的虚拟内存使用量.(通常是我们当前使用内存的1.5~3倍)

    D. GameObjects in Scene:

       当前帧场景中的GameObject数量.

    E. Total Objects in Scene:

       当前帧场景中的Object数量(除GameObject外,还有Component等).

    F. Total Object Count:

       Object数据 + Asset数量.

 

4. Detail Memory Profiler

    A. Assets:

       Texture2d:记录当前帧内存中所使用的纹理资源情况,包括各种GameObject的纹理、天空盒纹理以及场景中所用的Lightmap资源.

    B. Scene Memory:

       记录当前场景中各个方面的内存占用情况,包括GameObject、所用资源、各种组件以及GameManager等(天般情况通过AssetBundle加载的不会显示在这里).

    A. Other:

       ManagedHeap.UseSize:代码在运行时造成的堆内存分配,表示上次GC到目前为止所分配的堆内存量.

       SerializedFile(3):

       WebStream:这个是由WWW来进行加载的内存占用.

       System.ExecutableAndDlls:不同平台和不同硬件得到的值会不一样。******************

   

 

5. 优化重点

    A. CPU-GC Allow:

       关注原则:1.检测任何一次性内存分配大于2KB的选项 2.检测每帧都具有20B以上内存分配的选项.

    B. Time ms:

       记录游戏运行时每帧CPU占用(特别注意占用5ms以上的).

    C. Memory Profiler-Other:

       1.ManagedHeap.UsedSize: 移动游戏建议不要超过20MB.

       2.SerializedFile: 通过异步加载(LoadFromCache、WWW等)的时候留下的序列化文件,可监视是否被卸载.

       3.WebStream: 通过异步WWW下载的资源文件在内存中的解压版本,比SerializedFile大几倍或几十倍,重点监视.****

    D. Memory Profiler-Assets:

       1.Texture2D: 重点检查是否有重复资源和超大Memory是否需要压缩等.

       2.AnimationClip: 重点检查是否有重复资源.

       3.Mesh: 重点检查是否有重复资源.

 

6. 项目中可能遇到的问题

 

    A. Device.Present:

       1.GPU的presentdevice确实非常耗时,一般出现在使用了非常复杂的shader.

       2.GPU运行的非常快,而由于Vsync的原因,使得它需要等待较长的时间.

       3.同样是Vsync的原因,但其他线程非常耗时,所以导致该等待时间很长,比如:过量AssetBundle加载时容易出现该问题.

       4.Shader.CreateGPUProgram:Shader在runtime阶段(非预加载)会出现卡顿(华为K3V2芯片).

    B. StackTraceUtility.PostprocessStacktrace()和StackTraceUtility.ExtractStackTrace():

       1.一般是由Debug.Log或类似API造成.

       2.游戏发布后需将Debug API进行屏蔽.

 

    C. Overhead:

       1.一般情况为Vsync所致.

       2.通常出现在Android设备上.

    D. GC.Collect:

       原因: 1.代码分配内存过量(恶性的) 2.一定时间间隔由系统调用(良性的).

       占用时间:1.与现有Garbage size相关 2.与剩余内存使用颗粒相关(比如场景物件过多,利用率低的情况下,GC释放后需要做内存重排)

    E. GarbageCollectAssetsProfile:

       1.引擎在执行UnloadUnusedAssets操作(该操作是比较耗时的,建议在切场景的时候进行).

       2.尽可能地避免使用Unity内建GUI,避免GUI.Repaint过渡GC Allow.

       3.if(other.tag == GearParent.MogoPlayerTag)改为other.CompareTag(GearParent.MogoPlayerTag).因为other.tag为产生180B的GC Allow.

    F. 少用foreach,因为每次foreach为产生一个enumerator(约16B的内存分配),尽量改为for.

    G. Lambda表达式,使用不当会产生内存泄漏.

    H. 尽量少用LINQ:

       1.部分功能无法在某些平台使用.

       2.会分配大量GC Allow.

    I. 控制StartCoroutine的次数:

       1.开启一个Coroutine(协程),至少分配37B的内存.

       2.Coroutine类的实例 -- 21B.

       3.Enumerator -- 16B.

    J. 使用StringBuilder替代字符串直接连接.

    K. 缓存组件:

       1.每次GetComponent均会分配一定的GC Allow.

       2.每次Object.name都会分配39B的堆内存.

这篇关于通过profiler对unity进行针对性优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1075984

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

遮罩,在指定元素上进行遮罩

废话不多说,直接上代码: ps:依赖 jquer.js 1.首先,定义一个 Overlay.js  代码如下: /*遮罩 Overlay js 对象*/function Overlay(options){//{targetId:'',viewHtml:'',viewWidth:'',viewHeight:''}try{this.state=false;//遮罩状态 true 激活,f

利用matlab bar函数绘制较为复杂的柱状图,并在图中进行适当标注

示例代码和结果如下:小疑问:如何自动选择合适的坐标位置对柱状图的数值大小进行标注?😂 clear; close all;x = 1:3;aa=[28.6321521955954 26.2453660695847 21.69102348512086.93747104431360 6.25442246899816 3.342835958564245.51365061796319 4.87