学习笔记 adr 与 ldr 的使用及两者的区别(基于ARM架构 )

2024-05-09 02:18

本文主要是介绍学习笔记 adr 与 ldr 的使用及两者的区别(基于ARM架构 ),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

<学习笔记> adr 与 ldr 的使用及两者的区别(基于ARM架构)

使用环境:
环境系统: Ubuntu 14.04.4
适用于 mini2440的工具集合:
arm-linux-cpp : arm-none-linux-gnueabi-cpp (ctng-1.6.1) 4.4.3
arm-linux-as : GNU assembler (GNU Binutils) 2.20
arm-linux-ld : GNU ld (GNU Binutils) 2.20
arm-linux-objdump :GNU objdump (GNU Binutils) 2.20


示例用代码

➜ ~/test: cat ldr_adr.S

.text
.globl _start_start:
ldr r0,_reset
adr r0,_reset
ldr r0,=_reset
nop_reset:mov r1,#10
nop

源码反汇编

➜ ~/test: arm-linux-as ldr_adr.S -o ldr_adr.o
➜ ~/test: arm-linux-objdump -d ldr_adr.o

ldr_adr.o:     file format elf32-littlearm
Disassembly of section .text:00000000 <_start>:0:   e59f0008    ldr r0, [pc, #8]    ; 10 <_reset>4:   e28f0004    add r0, pc, #48:   e59f0008    ldr r0, [pc, #8]    ; 18 <_reset+0x8>c:   e1a00000    nop         ; (mov r0, r0)00000010 <_reset>:10:   e3a0100a    mov r1, #1014:   e1a00000    nop         ; (mov r0, r0)18:   00000010    .word   0x00000010

反汇编分析

1. 第一条指令: ldr r0,_reset

这是一条正常的ARM指令,目的是从内存地址中读取数值,而这里的地址值为标号”_reset”所对应的值,即0x00000010。

从反汇编结果可以看到,指令被“翻译”成了ldr r0, [pc, #8],是根据pc值作偏移进行间接寻址访问

ARM架构规定pc值为当前执行指令地址加8,即当前指令下两条指令地址

所以:
当前地址值为:0x0
PC值为: 0x0 + 8 = 0x8
而操作数 [pc, #8] 的结果是 [0x10] (pc的值加8),最后获取的是标号“_start”所指地址0x10存储的数据值,所以此时r0的值为e1a00000 .

2. 第三条指令(不要问我为什么是3): ldr r0,=_reset

这是一条伪指令,会被汇编器汇编为一个ARM指令。
可以看到此时的反汇编结果与第一条指令的反汇编结果很相似: ldr r0, [pc, #8]

但是,通过细心的计算pc偏移值:
当前地址值:0x8
pc值:0x8 + 8 = 0x10
而此时的反汇编寄存器访问指令的操作数为 [pc,#8] ,结果是[0x18](pc的值再加8) ,而最后结果就是获取地址为0x18所存放的数据。

再看看反汇编代码部分:

00000010 <_reset>:
10: e3a0100a mov r1, #10
14: e1a00000 nop ; (mov r0, r0)
18: 00000010 .word 0x00000010

地址0x18所存放的值是0x00000010,这个地址值正正就是标号 _start 所对应的值,
所以最后r0获得的是标号”_start”的所对应的地址值(0x00000010)。

3. 第二条指令:adr r0,_reset

这同样也是一条伪指令,此时反汇编的结果是 : add r0, pc, #4

其通过对pc进行加减操作进而获得了某个地址值,可以仔细算算:
当前地址值:0x4
pc值为:0x4 + 8 = 0x0C

而执行反汇编的指令add r0, pc, #4后,r0的值为pc+4,即0x10
这个0x10是什么呢?
在回去看看反汇编信息,获得的值,又是标号 _start 所在的地址,所以最后r0获得的是标号”_start”的对应的值(0x00000010)。

00000010 <_reset>:
10: e3a0100a mov r1, #10
14: e1a00000 nop ; (mov r0, r0)
18: 00000010 .word 0x00000010

所以,adr伪指令会被汇编器器产生单个 ADD 或 SUB 指令来装载地址值。如果不能在一个指令中构造该地址,则生成一个错误,并且汇编失败。


伪指令ldr与adr

从功能上来讲,adr与ldr伪指令功能是相同的,都是获取标号所对应的地址值。
但是,他们本质上有非常大的区别,下面我们在链接阶段指定链接地址:

➜ ~/test: arm-linux-ld ldr_adr.o -Ttext 0x2000 -o ldr_adr
➜ ~/test: arm-linux-objdump -d ldr_adr

ldr_adr:     file format elf32-littlearm
Disassembly of section .text:00002000 <_start>:2000:   e59f0008    ldr r0, [pc, #8]    ; 2010 <_reset>2004:   e28f0004    add r0, pc, #42008:   e59f0008    ldr r0, [pc, #8]    ; 2018 <_reset+0x8>200c:   e1a00000    nop         ; (mov r0, r0)00002010 <_reset>:2010:   e3a0100a    mov r1, #102014:   e1a00000    nop         ; (mov r0, r0)2018:   00002010    .word   0x00002010
➜  ~/test: 

结果没有区别?

  • 第二条指令:adr r0,_reset汇编成了add r0, pc, #4
    把”_reset”的地址加载到r0中,它是个相对地址。是相对PC作偏移获取到的地址值,是与位置无关的,他的值是不确定的,主要依赖于当前程序运行所在实际的地址空间。
    即当前PC值为0xc时,那么adr获得的地址为pc+4,那么获得的地址值r0就是0x10;而当pc值为0x200c时,那么获得的值为0x2010。

  • 第三条指令ldr r0, =_start汇编成了ldr r0, [pc, #8]

    看上去这只是一个指令,但是它要占用 2 个 32bit 的空间:

    • 一个是存放指令
    • 另一个是 “_start”标号的地址值
      (因为在编译的时候不能确定 _start 的值,所以不能直接用 mov 指令来给 r0 赋一个 32bit 的常量,所以需要多出一个空间存放 _start 的真正数据值,这个数据值是在链接的时候确定)。

    伪指令 ldr 是通过创建一个内存空间的形式,取得标号 _start 的绝对地址
    为什么说是绝对地址,因为这个地址是在链接的阶段就已经是确定的。

    • 当没有指定链接地址时:
      r0的值为从 地址0x18 获取的数据 0x00000010
    • 当指定链接地址时:
      r0的值为从 地址0x2018 获取的数据 0x00002010

    如下面的指定链接地址后,pc是通过获取地址为 地址0x2018所在内存的值,而这个值在链接阶段就已经确定,不管程序运行在哪个内存空间,他的值都是是固定不变的,获取的值都应该是0x00002010 .

00002010 <_reset>:  2010:   e3a0100a    mov r1, #102014:   e1a00000    nop         ; (mov r0, r0)2018:   00002010    .word   0x00002010

没看出来个究竟? adr与ldr两个指令有什么用?来看看u-boot源码中的代码搬运操作:

    .globl  relocate_code
relocate_code:mov r4, r0  /* save addr_sp */mov r5, r1  /* save addr of gd */mov r6, r2  /* save addr of destination *//* Set up the stack                         */
stack_setup:mov sp, r4adr r0, _startcmp r0, r6moveq   r9, #0      /* no relocation. relocation offset(r9) = 0 */beq clear_bss       /* skip relocation */mov r1, r6          /* r1 <- scratch for copy_loop */ldr r3, _bss_start_ofsadd r2, r0, r3      /* r2 <- source end address     */copy_loop:ldmia   r0!, {r9-r10}       /* copy from source address [r0]    */stmia   r1!, {r9-r10}       /* copy to   target address [r1]    */cmp r0, r2                  /* until source end address [r2]    */blo copy_loop

先关注 adr r0, _start这条指令,他主要获取标号_start地址值,注意,这里时相对与PC值的地址 。
然后执行cmp r0, r6,这是干嘛呢?

  • 其中r0代表了此时程序执行时的实际物理地址值(_start对应的是uboot源码的第一条指令的地址),所以,此时r0是u-boot源码第一条指令所在位置,可以是任何地址值
  • r6代表了u-boot源码需要重定位的地址值,就是SDRAM的地址。

在正常情况下,SOC启动后会执行u-boot,然而一般的存储介质都不具备执行程序的条件,所以需要把u-boot代码搬运到SDRAM当中。而正常情况下这样的cmp r0, r6 得到的结果肯定是不相等的,后面就执行代码搬运操作。

而当u-boot代码本来就运行在内存当中呢?这个时候adr r0, _start 取得的地址就是SDRAM中的地址值,cmp r0, r6 得到的结果就是相等的,后面就不做搬运代码的操作,因为本来就在SDRAM中执行的u-boot。

所以adr伪指令一般都用于判断当前程序运行地址所在空间。

这篇关于学习笔记 adr 与 ldr 的使用及两者的区别(基于ARM架构 )的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/972111

相关文章

从零教你安装pytorch并在pycharm中使用

《从零教你安装pytorch并在pycharm中使用》本文详细介绍了如何使用Anaconda包管理工具创建虚拟环境,并安装CUDA加速平台和PyTorch库,同时在PyCharm中配置和使用PyTor... 目录背景介绍安装Anaconda安装CUDA安装pytorch报错解决——fbgemm.dll连接p

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内 引用自定义组件:四、dhtmlx

使用Python创建一个能够筛选文件的PDF合并工具

《使用Python创建一个能够筛选文件的PDF合并工具》这篇文章主要为大家详细介绍了如何使用Python创建一个能够筛选文件的PDF合并工具,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录背景主要功能全部代码代码解析1. 初始化 wx.Frame 窗口2. 创建工具栏3. 创建布局和界面控件4

一文详解如何在Python中使用Requests库

《一文详解如何在Python中使用Requests库》:本文主要介绍如何在Python中使用Requests库的相关资料,Requests库是Python中常用的第三方库,用于简化HTTP请求的发... 目录前言1. 安装Requests库2. 发起GET请求3. 发送带有查询参数的GET请求4. 发起PO

Java中的Cursor使用详解

《Java中的Cursor使用详解》本文介绍了Java中的Cursor接口及其在大数据集处理中的优势,包括逐行读取、分页处理、流控制、动态改变查询、并发控制和减少网络流量等,感兴趣的朋友一起看看吧... 最近看代码,有一段代码涉及到Cursor,感觉写法挺有意思的。注意是Cursor,而不是Consumer

Node.js net模块的使用示例

《Node.jsnet模块的使用示例》本文主要介绍了Node.jsnet模块的使用示例,net模块支持TCP通信,处理TCP连接和数据传输,具有一定的参考价值,感兴趣的可以了解一下... 目录简介引入 net 模块核心概念TCP (传输控制协议)Socket服务器TCP 服务器创建基本服务器服务器配置选项服

如何使用CSS3实现波浪式图片墙

《如何使用CSS3实现波浪式图片墙》:本文主要介绍了如何使用CSS3的transform属性和动画技巧实现波浪式图片墙,通过设置图片的垂直偏移量,并使用动画使其周期性地改变位置,可以创建出动态且具有波浪效果的图片墙,同时,还强调了响应式设计的重要性,以确保图片墙在不同设备上都能良好显示,详细内容请阅读本文,希望能对你有所帮助...

Rust中的注释使用解读

《Rust中的注释使用解读》本文介绍了Rust中的行注释、块注释和文档注释的使用方法,通过示例展示了如何在实际代码中应用这些注释,以提高代码的可读性和可维护性... 目录Rust 中的注释使用指南1. 行注释示例:行注释2. 块注释示例:块注释3. 文档注释示例:文档注释4. 综合示例总结Rust 中的注释

解读Pandas和Polars的区别及说明

《解读Pandas和Polars的区别及说明》Pandas和Polars是Python中用于数据处理的两个库,Pandas适用于中小规模数据的快速原型开发和复杂数据操作,而Polars则专注于高效数据... 目录Pandas vs Polars 对比表使用场景对比Pandas 的使用场景Polars 的使用

Linux使用cut进行文本提取的操作方法

《Linux使用cut进行文本提取的操作方法》Linux中的cut命令是一个命令行实用程序,用于从文件或标准输入中提取文本行的部分,本文给大家介绍了Linux使用cut进行文本提取的操作方法,文中有详... 目录简介基础语法常用选项范围选择示例用法-f:字段选择-d:分隔符-c:字符选择-b:字节选择--c