本文主要是介绍Bss 段及利用符号表重定位后的管理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Bss 段:
首先,下面这张图描述了bss段在ELF格式中的位置:
bss段中包含了:
只定义但未初始化的全局变量和局部静态变量,但这些变量不会储存在bin 文件中,因为储存这些0值没有很大的意义,如果你定义了
unsigned int arr[1000000]={0};
那bin文件得变得多大呀,所以在目标文件(*.o)和可执行文件中,BSS段只是为未初始化的全局变量和未初始化的局部静态变量预留位置而已,它并没有内容,所以它不占据空间。程序在运行时,才会给BSS段里面的变量分配内存空间,我们要做的就是把重新定位后分配的内存空间清零就是了,毕竟储存的是0值嘛。
利用链接脚本可知Bss 段的起始地址和终止地址,
查看反汇编,看看Bss段将来会占据多少地址
先看 链接脚本 里是如何写的
SECTIONS
{ . = 0x20000000; . = ALIGN(4); .text : { *(.text) } . = ALIGN(4); .rodata : { *(.rodata) } . = ALIGN(4); .data : { *(.data) } . = ALIGN(4); __bss_start = .; .bss : {*(.bss) *(.COMMON) } _end = .;}
下面是将iNAND中整个程序 重定位 的代码 :
我们具体研究Bss段的重定位
链接脚本中注意如下两个获取当前链接位置的变量
led.c中定义如下变量
注意:
在目标文件(*.o)和可执行文件中,BSS段只是为未初始化的全局变量和未初始化的局部静态变量预留位置而已,它并没有内容,所以它不占据空间。
例如,在反汇编中有这样一段
程序在运行时,才会给BSS段里面的变量分配内存空间。
那程序运行时,依据什么来给全局变量和未初始化的局部静态变量分配空间呢,这里就要利用预留位置搭配符号表来实现了
符号表(symbol table)
符号表在编译时初步生成,链接后最终包含了C语言中变量名和地址
对于C语言来讲,在编译时symbol table里面存放了c变量的名字(name) 。链接时确定变量的地址
对于lsd文件,:为了在C程序中使用lsd中的值,借助了symbol table保存lds的变量的值,同样是在编译时在symbol table里面存放了lds中变量的名字(name),在链接时确定变量的值(注意:是值,不是地址),为了保持代码一致,使用C语言访问时:
先进行外部声明
再加上&得到它的值
这样看来,一个object文件的符号表保存了一个程序在定位和重定位时需要的定义和引用的信息。
在 Deepin 下,我们使用 nm -C 命令来看看symbol table 到底长啥样
20000000 t $a
20000080 t $a
200000c4 t $a
2000010c t $a
2000037c A __bss_start
20000050 t clean
2000002c t cpy
20000068 t $d
2000037c b $d
200000b8 t $d
20000108 t $d
20000320 t $d
200000c4 T delay
20000384 A _end
200001d4 t find_lock_val
2000037c B g_A
20000380 B g_B
20000080 T led_blink
2000010c T sdram_asm_init
20000000 T _start
关于nm命令的用途:借鉴了这篇博客:使用nm命令获取可执行文件里的符号,在此表示感谢
-
主要查看可执行文件里有没有指定的符号
格式 nm -C 可执行文件 | grep 符号
如nm -C helloworld | grep hello1 -
解决程序编译时undefined reference的错误及mutiple definition
-
查看某个符号的地址,以及进程空间的大概位置bss、data、text区,具体可以通过第二列的类型来判断。
符号
类型说明参考了nm指令,在此表示感谢
A
该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。
B
该符号的值出现在非初始化数据段(bss)中。例如,在一个文件中定义全局static int test。则该符号test的类型为b,位于bss section中。其值表示该符号在bss段中的偏移。一般而言,bss段分配于RAM中
重定位 bss 段:
C语言中
void clean_bss(void)
{ /* 要从lds文件中获得 __bss_start, _end */ extern int _end, __bss_start;volatile unsigned int *start = (volatile unsigned int *)&__bss_start; volatile unsigned int *end = (volatile unsigned int *)&_end;while (start <= end) { *start++ = 0; }
}
汇编中
可直接引用lds中的变量,例如
先看bss 的起始地址
查看反汇编
也就是 r1=0x2000037c
再来看bss 的结束地址
查看反汇编
r2=0x20000384
即,在bss段中
_endr2 - __bss_start = r2 - r1= 0x20000384 - 0x2000037c =0x8
也就是说,我们重定位后需要清零8字节的区域
问:
为什么是8字节?
答:
定义后初值为零或只定义未赋初值的全局变量,在led.c中一共就两个,且为int 类型
本文还参考了:
linux 目标文件(*.o) bss,data,text,rodata,堆,栈
C++初探:c和c++的区别简述,以及编译器对代码做了什么?
本人使用X210开发板编写并验证了代码重定位,好记性不如烂博客,整理如上,如有错误,欢迎评论区指出交流,谢谢支持。
这篇关于Bss 段及利用符号表重定位后的管理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!