Unity热更新技术学习——Lua,Luajit

2024-03-25 03:32

本文主要是介绍Unity热更新技术学习——Lua,Luajit,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • Lua
        • 预编译资源
        • 使用 Lua
        • luajit
    • 其他语言
    • 关于JIT
        • IOS 和 JIT
        • IOS 和 jit 的后话

Lua

Lua是一门轻量级的脚本语言,使用C语言编写,编译器和解释器也是C语言编写。

下载资源:

  • 源码 http://www.lua.org/ftp/
  • 预编译好的Lua库和编译器 http://luabinaries.sourceforge.net/
预编译资源

下载第二个预编译好的lua资源(windows平台),包含如下文件:
在这里插入图片描述

文件描述
lua.exelua脚本的编译器
lua53.dlllua5.3的库
luac.exe它将lua脚本翻译成字节码并输出到文本,而不会去执行。
wlua.exewindows下的lua.exe
使用 Lua

将上面lua.exe所在的目录加入环境变量。新建一个lua脚本:test.lua。循环执行一段包含取余,乘法和加法的运算。然后测量其执行时间。

st = os.clock()a = 1
for i = 1, 100000000 dob = i % 1000a = b * b + 1
endet = os.clock()
print(string.format("cost time: %.2f s", (et - st)))

在命令行中敲入:

lua test.lua

结果:
在这里插入图片描述

luajit

luajit是Lua的另一款编译器,采用了JIT —— Just In Time技术。从 luajit 官网 扒下来一张图它与普通的lua的编译器的速度区别(Arm 架构):
在这里插入图片描述
图中显示,在多种基准测试中,luajit最快可以达到普通lua编译器的64倍。

我没找到它提供的预编译的版本,所以就先在 这里 下载luajit的源码。选择最新的stable版本即可。

在编译之前,你需要在电脑中安装好gcc和make工具,windows下推荐使用Cygwin工具下载,并使用阿里的Cygwin镜像。

解压源码,可以看到如下文件:
在这里插入图片描述
将命令行定位到当前目录,执行:

make

之后你就可以在 src 目录下找到 luajit.exe 了。
在这里插入图片描述
然后将src目录加入环境变量,并用luajit编译上面的lua脚本:

luajit test.lua

结果:
在这里插入图片描述
快了13倍!

其他语言

同样可以编写类似的C语言程序和python程序:

#include <stdio.h>
#include <time.h>int main()
{clock_t st, et;st = clock();int a = 1;for(int i=0;i<100000000;i++){int b = i % 1000;a = b * b + 1;}et = clock();printf("cost time: %f", (double)(et - st)/CLOCKS_PER_SEC);return 0;
}
import timest = time.time()a = 1
for i in range(100000000):b = i % 1000a = b * b + 1et = time.time()
print(f"cost time: {et - st} s")

C语言的结果:
在这里插入图片描述
Python的结果:
在这里插入图片描述
在这里插入图片描述

关于JIT

一般来说,将我们书写的源代码转化成目标机器CPU能够识别的机器指令有两种方法:

  1. 直接将源代码转化成机器码,然后执行程序;
  2. 实现一个解释器,然后使用解释器一句一句地将源码翻译成机器码并执行。

Lua就是第二种方式。lua.exe中的编译程序将lua源代码转化成平台无关的伪代码——字节码,然后再由解释程序将字节码一句句解释成机器码并执行。字节码的出现让语言能够很轻松地移植到多平台运行,而你只需要实现不同平台下的解释器即可。

Pascal是最早使用中间伪代码的一种语言,那时候,这种中间伪代码还叫(P-Code,即Pascal Code),后来被这个名称渐渐被字节码所取代,因为大多数的语言的中间伪代码都是一个字节的长度。

跨平台的问题解决了,却产生了性能问题。将字节码解释成机器码再执行肯定不如直接执行机器码来得快。而JIT的出现就是为了尝试结合两者的优点。它会在运行时将一部分经常执行的字节码转化成机器码,然后之后都会直接执行机器码。

理论上如果程序运行的时间足够长,那JIT的性能应当和静态编译的程序性能很相近。

一些采用JIT技术的例子:

  • Java:JVM(Java Virtual Machine)
  • C#:CLR(Common Language Runtime)
  • Android:DVM(Dalvik Virtual Machine),ART(Android RunTime)

在Java的例子中,JVM会追踪每个函数的执行计数,如果执行计数超过某个阈值,JVM会将该函数的字节码转化成机器码,之后执行到该函数的时候就直接执行机器码,而不是重复逐行解释逐行运行。

IOS 和 JIT

假如有这么一段代码:

int a = 1;
int b = a * 3 + 2;

然后虚拟机将它翻译成如下的字节码(下面用伪代码代替):

asg a 1 // 赋值
asg temp [a] // 赋值
mul temp 3 // 乘
add temp 2 // 加
asg b [temp] // 赋值

上面有三种不同的字节码,即赋值(asg),乘法(mul),加法(add),虚拟机进一步解释字节码可以这么写:

void exec_bytecode(bytecode){string code_name = bytecode[0]; // 字节码的第一部分,表示操作val code_val_1 = bytecode[1]; // 字节码的第二部分,第一个操作数val code_val_2 = bytecode[2]; // 字节码的第三部分,第二个操作数switch(code_name){case "asg":set_register_val(code_val_1, code_val_2); // 为一个与 code_val_1 关联的寄存器赋值break;case "mul":mul_register_val(code_val_1, code_val_2); // 将 code_val_1 关联的寄存器中的值乘以 code_val_2 然后放回 code_val_1 关联的寄存器中。break;case "add":add_register_val(code_val_1, code_val_2); // 将 code_val_1 关联的寄存器中的值加上 code_val_2 然后放回 code_val_1 关联的寄存器中。break;default:// do something...}
}

某个实现了JIT的虚拟机需要将某一段字节码转化成机器码,为此它需要做这么几件事情:

  • 申请一个可执行内存,将翻译后的机器码放入内存中
  • 每当CPU执行到该函数的时候,虚拟机将CPU的指令寄存器修改到机器码所在的地址

然而在IOS中,第一步的申请可执行内存就是被禁止的行为。

每当提交一个应用程序给Apple时,它会对你的代码做审核和代码签名,标识你的程序所在的地址空间是可执行的。但它不允许你的程序新申请别的可执行内存,因为它绕过了Apple的代码验证。

更详细地说,无论从你的源码所生成的字节码是什么,字节码都不是可执行的。

  1. 如果你不采用JIT,最终执行的就是虚拟机中的代码,因为虚拟机已经写好了如何“解释”字节码的程序,你只需要运行这部分程序就可以了,而这部分代码在应用程序提交给Apple的时候就已经做过代码签名验证了。
  2. 相反,如果你采用JIT,你为字节码新生成的机器码是新的可执行代码,这在Apple看来是不被允许的。

这也就是为什么Lua的JIT在IOS平台上是不可用的原因,不过这也是后话了。

IOS 和 jit 的后话

IOS禁止jit已经是众所周知了,但是macOS是可以使用JIT的。只需要在申请内存的时候,给系统传递个 MAP_JIT 即可。请参考:
Allow Execution of JIT-compiled Code Entitlement

2020-10-12 补充:上面测试速度的代码例子可能不太准确,但是不同解释器/编译器的速度排序是对的。因为C的编译器在实际使用的时候往往会至少开启-O2级别的优化,做了优化之后,上面for循环中,实际只做了1000遍运算(因为往后,b和a都是重复赋值),所以C的运算结果耗时打印为0。
另外,尽管luajit无法在IOS上使用,但是luajit提供了解释器模式来兼容IOS平台。在windows/linux上,我们可以给luajit加上-joff 参数来使用解释器模式而不是JIT模式。这个测试下来会发现,luajit的解释器依然比lua原生的解释器要快上一倍左右。

这篇关于Unity热更新技术学习——Lua,Luajit的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/843722

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

poj3468(线段树成段更新模板题)

题意:包括两个操作:1、将[a.b]上的数字加上v;2、查询区间[a,b]上的和 下面的介绍是下解题思路: 首先介绍  lazy-tag思想:用一个变量记录每一个线段树节点的变化值,当这部分线段的一致性被破坏我们就将这个变化值传递给子区间,大大增加了线段树的效率。 比如现在需要对[a,b]区间值进行加c操作,那么就从根节点[1,n]开始调用update函数进行操作,如果刚好执行到一个子节点,

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

hdu1689(线段树成段更新)

两种操作:1、set区间[a,b]上数字为v;2、查询[ 1 , n ]上的sum 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<queue>#include<set>#include<map>#include<stdio.h>#include<stdl

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss