ARMv8 Cortex-a 编程向导手册学习_4. A64指令集

2024-03-12 12:59

本文主要是介绍ARMv8 Cortex-a 编程向导手册学习_4. A64指令集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

/* TODO 本系列文章是对 ARMv8 Cortex-a 系列编程向导手册拙劣的翻译和注解,若有出入,以官方文档为准 */

Chapter 6 A64指令集

大多数程序员并不需要使用汇编语言编写应用程序,但是汇编代码可以有效的优化代码性能。而且当编写编译器,或者使用 CPU 底层功能,或者编写启动代码、设备驱动以及操作系统中断相关的任务切换时,此时不能直接使用 C 语言,而需要使用汇编;当调试代码时,我们需要有效的理解汇编指令与 C 程序流的映射关系。

6.1 指令助记符

A64 的指令可以操作32位以及64位值,这两种情况下采用不同的编码方式,编译器根据寄存器名字,来区分当前操作的是 32 位值还是 64 位值。示例如下:

ADD W0, W1, W2 // 32 位寄存器的加法
ADD X0, X1, X2 // 64位寄存器的加法
ADD X0, X1, W2, SXTW // add sign extended 32-bit register to 64-bit extended register
ADD X0, X1, #42 // 64 位寄存器与立即数的加法
ADD V0.8H, V1.8H, V2.8H // NEON 16-bit add, in each of 8 lanes

6.2 数据处理指令

A64 提供一些重要的算数与逻辑操作指令,应用于寄存器与寄存器之间,或者寄存器与立即数之间,乘法与除法指令被当作特殊的数据处理指令。
绝大多数数据处理指令使用一个目的寄存器和两个源操作数,这些指令的通用格式如下:
Instruction Rd, Rn, Operand2
数据处理指令包括:

  • 算数与逻辑操作指令
  • 赋值与移位指令
  • 符号与0扩展指令
  • 位域操作指令
  • 条件比较与数据处理指令

6.3.1 算数与逻辑操作

在这里插入图片描述
上图中列出了:

  • 算数指令
  • 逻辑指令
  • 比较指令
  • 赋值指令

一些指令拥有 s 后缀,表示该指令会根据指令执行的结果设置 PSTATE 的 NZCV 标志位。
指令使用示例如下:

ADD W0, W1, W2, LSL #3 // W0 = W1 + (W2 << 3)
SUBS X0, X4, X3, ASR #2 // X0 = X4 - (X3 >> 2), set flags
MOV X0, X1 // Copy X1 to X0
CMP W3, W4 // Set flags based on W3 - W4
ADD W0, W5, #27 // W0 = W5 + 27
MOV X1, #0x800 // x1 = 0x8000
BIC X0, X0, X1 // x0 &= ~x1

比较指令只设置标志位,不会保存结果 ,在上述算符与逻辑指令中,能处理的立即数的范围是 12 位,这个12位可以是 64 位值中任意的连续的 12 位。

6.2.2 乘法与除法指令

MUL X0, X1, X2 // X0 = X1 * X2
UDIV W0, W1, W2 // W0 = W1 / W2 (unsigned, 32-bit divide)
SDIV X0, X1, X2 // X0 = X1 / X2 (signed, 64-bit divide)

6.2.3 移位操作指令

移位操作指令存在如下类型:

  • 逻辑左移:LSL,该指令等于乘以2的幂次
  • 逻辑右移:RSL, 该指令等于除以2的幂次
  • 算法右移:ASR,该指令等于除以2的幂次,但会保留符号位
  • 循环右移:ROR, 该指令的 LSB 位会填充到 MSB 位

4种移位操作的示例图如下:
在这里插入图片描述
移位操作可以使用32位或64位的寄存器,移动的位数量可以是通过一个立即数指定,或者寄存器指定,如果通过寄存器指定,那么针对32位值的移位操作,寄存器的低5位指定位移动数量,如果针对64位值的移位操作,寄存器的低6位指定位移动数量。

6.2.4 位域与字节操作指令

与 ARMv7 类似, ARMv8 也提供了位域插入指令 BFI(Bit Fieled Insert) 以及位域提取指令S/UBFX(Bit Fieled Extract)。,用法与示例如下图:
在这里插入图片描述

6.2.5 条件指令

AArch64 的程序状态位域 PSTATE 提供了4个条件标志位:NZCV(与 ARMv7 类似),标志位描述如下表:

标志位描述
NNegative, 负值标志位 ,表示指令结果为一个负值
ZZero, 0 标志位,如果指令结果是0,则置位该标志位,表示两个操作数拥有相同的值
CCarry, 进位标志位
VOverflow, 溢出标志位,上溢或下溢

存在如下条件码:
在这里插入图片描述
上图这些条件码,在 PSTATE 的对应 Condition Flag 为对应的值时为真。
比如,如下:

b.eq	__main	/* 如果此时 Z 置位,那么跳转到 __main() */
b.ne 	__secondary_init /* 如果此时 Z 没有置位,那么跳转到 __secondary_init()*/

着重注意的指令:
条件比较指令:cmp 和 cmn,如果比较的结果为真,cpu 会设置条件标志位。
条件选择指令:csel,会根据指令跟随的条件码,选择相对应赋值操作。示例如下:

CMP w0, #0 // if (i == 0)
SUB w2, w1, #1 // r = r - 1
ADD w1, w1, #2 // r = r + 2
CSEL w1, w1, w2, EQ // select between the two results

上述汇编对应如下的 C 语句

if (i == 0) r = r + 2; else r = r - 1;

6.3 内存访问指令

跟 ARMv7 类似,ARMv8 架构也是一个 Load/Store 架构,即,不提供直接访问内存地址的数据处理指令(6.2章节提供的指令都时不能直接访问内存地址)。
数据首先被加载到通用目的寄存器中,然后才能使用数据处理指令进行修改,最后再存储到指定的地址中。
内存地址的访问流程即是:加载-数据处理-存储。

6.3.1 内存加载指令格式

通用的内存加载指令格式如下:

LDR Rt, <addr>	//将 addr 地址的值加载到 Rt 寄存器中

我们可以在 LDR 指令后加后缀的形式,选择加载的数据宽度:

LSRB加载字节数据,目的寄存器的高位填充0
LSRSB加载字节数据,目的寄存器的剩余高位填充符号位
LSRH加载半字数据,目的寄存器的剩余高位填充0
LSRSH加载半字数据,目的寄存器的剩余高位填充符号位
LSRWS加载字数据,目的寄存器的剩余高位填充符号位

上述内存加载指令的用法示例图如下:

在这里插入图片描述

6.3.2 内存存储指令

Store 指令常用格式如下:

STR Rn, <addr>	//将 Rn 的值保存到 addr 地址处

如果要存储的数据小于寄存器的宽度,那么我们可以使用‘B’或‘H’后缀,此时会将寄存器的低位存储到指定的地址。

6.3.3 浮点与 NEON 精度加载与存储

内存加载与存储指令也可以访问浮点寄存器。
在这里插入图片描述

6.3.4 加载指定地址处的值

offset mode:偏移模式
偏移寻址模式将一个立即数值或一个可修改的寄存器值添加到目的寄存器中用于生成地址:
在这里插入图片描述
index mode :索引模式
索引模式与偏移寻址模式相似,但索引模式会更新基寄存器的值:
在这里插入图片描述
PC-relative mode:PC相关模式
A64 增加了其他的寻址模式,比如可以从一个标号地址加载数据,如下:
在这里插入图片描述

6.3.5 访问多个内存位置

A64 不支持 LDM 与 STM 指令,只支持 LDP 与 STP 指令。
LDP 与 STP 指令一次可以访问两个通用目的寄存器来读或写。
指令使用示例如下:
在这里插入图片描述
图解如下:
在这里插入图片描述

6.3.6 非特权访问

6.3.7 内存提取指令

6.3.8 非临时加载与存储对

6.3.9 内存访问原子性

当使用 LDR 与 STR 指令,通过通用目的寄存器访问地址对齐的内存时,硬件保证这个访问是原子性的。
当使用 LDP 与 STP 指令,通过通用目的寄存器对访问地址对齐的内存时,硬件保证这两个寄存器的访问是两个单独的原子操作。
浮点内存访问时,硬件不保证原子性。

6.3.10 内存屏障与栅栏指令

  • DMB, 数据内存屏障
  • DSB, 数据同步屏障
  • ISB, 指令同步屏障

6.3.11 同步?

6.4 程序流控指令

A64 提供大量的不同种类的程序跳转指令。
在这里插入图片描述
当使用 BL 或 BLR 调用函数时,会使用 X30 保存函数返回地址。

6.5 系统控制与其他指令

6.5.1 异常处理指令

存在3种异常生成指令:

异常生成指令描述
SVC #imm16生成 EL1 异常
HVC #imm16生成 EL2 异常
SMC #imm16生成 EL3 异常

上表中,立即数的值保存在 ESR_ELn 寄存器中,可供异常服务函数处理。
当从异常退出时,我们使用ERET 指令,这个指令会使用 SPSR_ELn 寄存器的值设置 PSTATE,并会跳转到 ELR_ELn 保存的地址处开始执行代码。

6.5.3 系统寄存器访问指令

系统寄存器的访问使用 MSRMRS 指令

这篇关于ARMv8 Cortex-a 编程向导手册学习_4. A64指令集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/801338

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识