Hi3520D上手过程之Kernel前段学习

2023-10-14 08:20

本文主要是介绍Hi3520D上手过程之Kernel前段学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、Kernel的入口

二、Kernel的启动过程

1. head.S过程分析

(1)判断内核版本是否支持该CPU

(2)保存RAM的起始物理地址到r8寄存器

(3)校验参数的合法性(__vet_atags)

(4)创建一级页表

(5)保存最后的跳转地址,设置处理器和MMU相关寄存器

(6)使能MMU

(7)head.S的终点


一、Kernel的入口

在前一篇博客中,总结了u-boot的过程,最后定义了u-boot的终点,这就是Kernel的起点,如下所示

theKernel = (void (*)(int, int, uint))images->ep;
theKernel (0, machid, bd->bi_boot_params); 

而且分析到了images->ep的值就是0x80008000,那么0x80008000到底对应于Kernel的哪一出并不得而知。

先看内核的生成过程:

(1)make ARCH=arm CROSS_COMPILE=arm-hisiv100nptl-linux- hi3520d_full_defconfig

(2)make ARCH=arm CROSS_COMPILE=arm-hisiv100nptl-linux- -j20

(3)make ARCH=arm CROSS_COMPILE=arm-hisiv100nptl-linux- uImage -j 20

运行完(2)后,输出:

Kernel:            arch/arm/boot/Image is ready

AS                  arch/arm/boot/compressed/piggy.gzip.o

LD                  arch/arm/boot/compressed/vmlinux

OBJCOPY       arch/arm/boot/zImage

Kernel:            arch/arm/boot/zImage is ready

首先要注意的是vmlinux即为俗称的内核,后面的zImage和uImage也是由它生成的,而vmlinux有两个:

(1)根目录下的vmlinux

(2)arch/arm/boot/compressed下的vmlinux

根据Makefile并跟进打印,得到过程如下:

# vmlinux
#   ^
#   |
#   +-< $(vmlinux-init)
#   |   +--< init/version.o + more
#   |
#   +--< $(vmlinux-main)
#   |    +--< driver/built-in.o mm/built-in.o + more
#   |
#   +-< kallsyms.o (see description in CONFIG_KALLSYMS section)vmlinux-init := $(head-y) $(init-y)
vmlinux-main := $(core-y) $(libs-y) $(drivers-y) $(net-y)quiet_cmd_vmlinux-modpost = LD      $@cmd_vmlinux-modpost = $(LD) $(LDFLAGS) -r -o $@                          \$(vmlinux-init) --start-group $(vmlinux-main) --end-group             \$(filter-out $(vmlinux-init) $(vmlinux-main) FORCE ,$^)# vmlinux image - including updated kernel symbols
vmlinux: $(vmlinux-lds) $(vmlinux-init) $(vmlinux-main) vmlinux.o $(kallsyms.o) FORCE
ifdef CONFIG_HEADERS_CHECK$(Q)$(MAKE) -f $(srctree)/Makefile headers_check
endif
ifdef CONFIG_SAMPLES$(Q)$(MAKE) $(build)=samples
endif
ifdef CONFIG_BUILD_DOCSRC$(Q)$(MAKE) $(build)=Documentation
endif$(call vmlinux-modpost)$(call if_changed_rule,vmlinux__)$(Q)rm -f .old_version

(1)链接arch/arm/kernel/head.o + arch/arm/kernel/init_task.o + init/ + kernel/ + mm/ + ... + net/ = 根目录vmlinux

$(obj)/Image: vmlinux FORCE$(call if_changed,objcopy)@echo '  Kernel: $@ is ready'

(2)将该vmlinux OBJCOPY(去掉调试信息等)后 = arch/arm/boot下的Image

$(obj)/vmlinux: $(obj)/vmlinux.lds $(obj)/$(HEAD) $(obj)/piggy.$(suffix_y).o \$(addprefix $(obj)/, $(OBJS)) $(lib1funcs) FORCE$(call if_changed,ld)@$(check_for_bad_syms)$(obj)/piggy.$(suffix_y): $(obj)/../Image FORCE$(call if_changed,$(suffix_y))$(obj)/piggy.$(suffix_y).o:  $(obj)/piggy.$(suffix_y) FORCE

(3)将arch/arm/boot/Image GZIP压缩后 = arch/arm/boot/compressed/piggy.gzip

 = arch/arm/boot/compressed/piggy.gzip.o

arch/arm/boot/compressed/head.o + arch/arm/boot/compressed/misc.o + arch/arm/boot/compressed/decompress.o + arch/arm/boot/compressed/piggy.gzip.o = arch/arm/boot/compressed/vmlinux

$(obj)/zImage:	$(obj)/compressed/vmlinux FORCE$(call if_changed,objcopy)@echo '  Kernel: $@ is ready'

(4)将arch/arm/boot/compressed/vmlinux OBJCOPY(去掉调试信息等)后 = arch/arm/boot/zImage

所以真正解压后的内核,运行的第一个文件由arch/arm/kernel的vmlinux.lds来决定

内核编译依靠linux源码根目录/arch/arm/kernel下的vmlinux.lds,而vmlinux.lds由linux源码根目录/arch/arm/kernel下的vmlinux.lds.s生成

OUTPUT_ARCH(arm)
ENTRY(stext)#ifndef __ARMEB__
jiffies = jiffies_64;
#else
jiffies = jiffies_64 + 4;
#endifSECTIONS
{
#ifdef CONFIG_XIP_KERNEL. = XIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR);
#else. = PAGE_OFFSET + TEXT_OFFSET;
#endif.init : {			/* Init code and data		*/_stext = .;_sinittext = .;HEAD_TEXTINIT_TEXTARM_EXIT_KEEP(EXIT_TEXT)_einittext = .;ARM_CPU_DISCARD(PROC_INFO)__arch_info_begin = .;*(.arch.info.init)__arch_info_end = .;__tagtable_begin = .;*(.taglist.init)__tagtable_end = .;
#ifdef CONFIG_SMP_ON_UP__smpalt_begin = .;*(.alt.smp.init)__smpalt_end = .;
#endif__pv_table_begin = .;*(.pv_table)__pv_table_end = .;INIT_SETUP(16)INIT_CALLSCON_INITCALLSECURITY_INITCALLINIT_RAM_FS#ifndef CONFIG_XIP_KERNEL__init_begin = _stext;INIT_DATAARM_EXIT_KEEP(EXIT_DATA)
#endif}

从代码可以看出,内核启动的虚拟地址被设置成了PAGE_OFFSET + TEXT_OFFSET,这个地址在linux源码根目录/arch/arm/boot下的Makefile有所提及

# Note: the following conditions must always be true:
#   ZRELADDR == virt_to_phys(PAGE_OFFSET + TEXT_OFFSET)

所以这里便把内核启动的物理地址和虚拟地址对应上了,且PAGE_OFFSET + TEXT_OFFSET的值也可以从最终生成的vmlinux.lds看出

OUTPUT_ARCH(arm)
ENTRY(stext)
jiffies = jiffies_64;
SECTIONS
{. = 0xC0000000 + 0x00008000;.init : { /* Init code and data		*/_stext = .;_sinittext = .;*(.head.text)*(.init.text) *(.cpuinit.text) *(.meminit.text)_einittext = .;__proc_info_begin = .; *(.proc.info.init) __proc_info_end = .;__arch_info_begin = .;*(.arch.info.init)__arch_info_end = .;__tagtable_begin = .;*(.taglist.init)__tagtable_end = .;__pv_table_begin = .;*(.pv_table)__pv_table_end = .;. = ALIGN(16); __setup_start = .; *(.init.setup) __setup_end = .;__initcall_start = .; *(.initcallearly.init) __early_initcall_end = .; *(.initcall0.init) *(.initcall0s.init) *(.initcall1.init) *(.initcall1s.init) *(.initcall2.init) *(.initcall2s.init) *(.initcall3.init) *(.initcall3s.init) *(.initcall4.init) *(.initcall4s.init) *(.initcall5.init) *(.initcall5s.init) *(.initcallrootfs.init) *(.initcall6.init) *(.initcall6s.init) *(.initcall7.init) *(.initcall7s.init) __initcall_end = .;__con_initcall_start = .; *(.con_initcall.init) __con_initcall_end = .;__security_initcall_start = .; *(.security_initcall.init) __security_initcall_end = .;. = ALIGN(4); __initramfs_start = .; *(.init.ramfs) . = ALIGN(8); *(.init.ramfs.info)__init_begin = _stext;*(.init.data) *(.cpuinit.data) *(.meminit.data) *(.init.rodata) *(.cpuinit.rodata) *(.meminit.rodata) . = ALIGN(32); __dtb_start = .; *(.dtb.init.rodata) __dtb_end = .;}

PAGE_OFFSET=0xC0000000,TEXT_OFFSET=0x00008000,它运行的位置为ENTRY(stext),这个在linux源码根目录/arch/arm/kernel下的head.S和head-nommu.S都有定义的

	__HEAD
ENTRY(stext)setmode	PSR_F_BIT | PSR_I_BIT | SVC_MODE, r9 @ ensure svc mode@ and irqs disabledmrc	p15, 0, r9, c0, c0		@ get processor idbl	__lookup_processor_type		@ r5=procinfo r9=cpuidmovs	r10, r5				@ invalid processor (r5=0)?THUMB( it	eq )		@ force fixup-able long branch encodingbeq	__error_p			@ yes, error 'p'
#define __HEAD		.section	".head.text","ax"

那么究竟使用的是哪一个呢?

其实linux源码根目录/arch/arm/kernel的Makefile中有

head-y			:= head$(MMUEXT).o
obj-$(CONFIG_DEBUG_LL)	+= debug.o
obj-$(CONFIG_EARLY_PRINTK)	+= early_printk.oextra-y := $(head-y) init_task.o vmlinux.lds

在linux源码根目录/arch/arm的Makefile中

ifeq ($(CONFIG_MMU),)
MMUEXT		:= -nommu
endif

实际上对于支持MMU的处理器,就不存在$(MMUEXT),而hi3520d是支持mmu的,从.config(即linux源码根目录/arch/arm/configs下的hi3520d_full_defconfig)中可以看到

#
# System Type
#
CONFIG_MMU=y

因此得出head.S便是内核的第一个运行文件,且运行位置为ENTRY(stext)处开始。

二、Kernel的启动过程

1. head.S过程分析

(1)判断内核版本是否支持该CPU

①读出协处理器cp15的c0寄存器来获取处理器id(保存在r9中)

mrc	p15, 0, r9, c0, c0		@ get processor id

②判断是否支持

bl	__lookup_processor_type		@ r5=procinfo r9=cpuid

__lookup_processor_type的真正实现在linux源码根目录/arch/arm/kernel的head-common.S中

	__CPUINIT
__lookup_processor_type:adr	r3, __lookup_processor_type_dataldmia	r3, {r4 - r6}sub	r3, r3, r4			@ get offset between virt&physadd	r5, r5, r3			@ convert virt addresses toadd	r6, r6, r3			@ physical address space
1:	ldmia	r5, {r3, r4}			@ value, maskand	r4, r4, r9			@ mask wanted bitsteq	r3, r4beq	2f                              @forwardadd	r5, r5, #PROC_INFO_SZ		@ sizeof(proc_info_list)cmp	r5, r6blo	1b                              @backwardmov	r5, #0				@ unknown processor
2:	mov	pc, lr
ENDPROC(__lookup_processor_type)/** Look in <asm/procinfo.h> for information about the __proc_info structure.*/.align	2.type	__lookup_processor_type_data, %object
__lookup_processor_type_data:.long	.                            @ will be saved to r4.long	__proc_info_begin   @ will be saved to r5.long	__proc_info_end      @ will be saved to r6.size	__lookup_processor_type_data, . - __lookup_processor_type_data

首先需要知道的是,在启用MMU之前,内核使用的都应该是物理地址,但是内核代码在链接时(依赖链接器脚本)的地址都是虚拟地址,因此需要有一个虚拟地址转换物理地址的过程,__lookup_processor_type的第一步就在做这个:

首先,通过adr指令,将__lookup_processor_type_data的物理地址读出来到r3;

然后,ldmia指令所做的是,将r3(__lookup_processor_type_data)虚拟地址读取到r4,将(r3+4)即__proc_info_begin读取到r5,将(r3+8)即__proc_info_end读取到r6;

然后,算出虚拟地址和物理地址的差;

最后,将r5中保存的__proc_info_begin和r6中保存的__proc_info_end的虚拟地址转换为物理地址。

那么__proc_info_begin和__proc_info_end究竟存的是什么,可从链接器脚本vmlinux.lds中看到线索

  __proc_info_begin = .; *(.proc.info.init) __proc_info_end = .;

*(.proc.info.init)就是答案,那么这个又对应的内容是什么,则需要在代码中找,但搜出的代码中有许多proc-xxx.S,至于究竟用哪个,首先看linux源码根目录下的.config

#
# Processor Type
#
CONFIG_CPU_V7=y

然后再在linux源码根目录/arch/arm/mm的Makefile中

obj-$(CONFIG_CPU_V7)		+= proc-v7.o

所以对应的代码应该是proc-v7.S

	.section ".proc.info.init", #alloc, #execinstr/* * ARM Ltd. Cortex A9 processor. */.type   __v7_ca9mp_proc_info, #object
__v7_ca9mp_proc_info:.long	0x410fc090		@ Required ID value.long	0xff0ffff0		@ Mask for IDALT_SMP(.long \PMD_TYPE_SECT | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READ | \PMD_FLAGS_SMP)ALT_UP(.long \PMD_TYPE_SECT | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READ | \PMD_FLAGS_UP).long   PMD_TYPE_SECT | \PMD_SECT_XN | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READW(b)	__v7_ca9mp_setup.long	cpu_arch_name.long	cpu_elf_name.long	HWCAP_SWP|HWCAP_HALF|HWCAP_THUMB|HWCAP_FAST_MULT|HWCAP_EDSP|HWCAP_TLS.long	cpu_v7_name.long	v7_processor_functions.long	v7wbi_tlb_fns.long	v6_user_fns.long	v7_cache_fns.size	__v7_ca9mp_proc_info, . - __v7_ca9mp_proc_info/** Match any ARMv7 processor core.*/.type	__v7_proc_info, #object
__v7_proc_info:.long	0x000f0000		@ Required ID value  /*unsigned int        cpu_val*/.long	0x000f0000		@ Mask for ID  /*unsigned int        cpu_mask*/ALT_SMP(.long \                  /*unsigned long        __cpu_mm_mmu_flags;    used by head.S */PMD_TYPE_SECT | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READ | \PMD_FLAGS_SMP)ALT_UP(.long \                     PMD_TYPE_SECT | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READ | \PMD_FLAGS_UP).long   PMD_TYPE_SECT | \       /*unsigned long        __cpu_io_mmu_flags;     used by head.S */PMD_SECT_XN | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READW(b)	__v7_setup        /*unsigned long        __cpu_flush;         used by head.S */.long	cpu_arch_name     /*const char        *arch_name;*/.long	cpu_elf_name       /*const char        *elf_name;*//*unsigned int        elf_hwcap;*/.long	HWCAP_SWP|HWCAP_HALF|HWCAP_THUMB|HWCAP_FAST_MULT|HWCAP_EDSP|HWCAP_TLS.long	cpu_v7_name     /*const char        *cpu_name;*/.long	v7_processor_functions   /*struct processor    *proc*/.long	v7wbi_tlb_fns     /*struct cpu_tlb_fns    *tlb*/.long	v6_user_fns       /*struct cpu_user_fns    *user*/.long	v7_cache_fns     /*struct cpu_cache_fns    *cache*/.size	__v7_proc_info, . - __v7_proc_info

这里面其实定义了两个结构__v7_ca9mp_proc_info和__v7_proc_info,每个结构具体的组成其实能够在linux源码根目录/arch/arm/include/asm的procinfo.h中找到

struct proc_info_list {unsigned int		cpu_val;unsigned int		cpu_mask;unsigned long		__cpu_mm_mmu_flags;	/* used by head.S */unsigned long		__cpu_io_mmu_flags;	/* used by head.S */unsigned long		__cpu_flush;		/* used by head.S */const char		*arch_name;const char		*elf_name;unsigned int		elf_hwcap;const char		*cpu_name;struct processor	*proc;struct cpu_tlb_fns	*tlb;struct cpu_user_fns	*user;struct cpu_cache_fns	*cache;
};

在proc-v7.S中也加上了注释,可以一一对应地看。其实最终使用的是__v7_ca9mp_proc_info,因为通过3520D_SDK根目录/release/00.hardware/chip/documents_cn中的Hi3520DV200 H.264编解码处理器简介.pdf可以看出其内核为ARM Cortex A9.

再回到__lookup_processor_type中,得到了__proc_info_begin的物理地址后,用ldmia指令取出了第一个proc_info_list结构的cpu_val(保存在r3)和cpu_mask(保存在r4),将cpu_mask和之前保存在r9中的处理器id做“与”操作,然后和cpu_val比较是否相等,相等则返回(此时r5保存的是所匹配到的proc_info_list结构的物理地址),不相等则接着往下找下一个proc_info_list结构,完成同样的判断,直到__proc_info_end还没找到,就将r5赋值为0返回,中间找到相等的就赋值给r5(匹配到的proc_info_list结构的物理地址)。返回后,将r5再赋值给r10。

(2)保存RAM的起始物理地址到r8寄存器

#ifndef CONFIG_XIP_KERNELadr	r3, 2fldmia	r3, {r4, r8}sub	r4, r3, r4			@ (PHYS_OFFSET - PAGE_OFFSET)add	r8, r8, r4			@ PHYS_OFFSET
#elseldr	r8, =PLAT_PHYS_OFFSET
#endif#ifndef CONFIG_XIP_KERNEL
2:	.long	..long	PAGE_OFFSET
#endif

内核中未定义CONFIG_XIP_KERNEL(查看.config:# CONFIG_XIP_KERNEL is not set),因此走的逻辑为:

r3读取标号2的物理地址;

标号2的虚拟地址给r4,PAGE_OFFSET的虚拟地址给r8;

物理地址和虚拟地址的差赋值给r4;

将r8转换为物理地址,即RAM的首地址,r4仍保存物理地址和虚拟地址的差。

(3)校验参数的合法性(__vet_atags)

①寄存器说明

在(1)部分后,目前已知的寄存器保存的值如下:

由于theKernel (0, machid, bd->bi_boot_params)作用,r0=0,r1=machid,r2=bd->bi_boot_params

r9=processor id,r10=匹配到的proc_info_list结构的物理地址,r8=RAM的起始物理地址,r4=物理地址-虚拟地址

②回顾u-boot参数传递过程

/* The list ends with an ATAG_NONE node. */
#define ATAG_NONE	0x00000000struct tag_header {u32 size;u32 tag;
};/* The list must start with an ATAG_CORE node */
#define ATAG_CORE	0x54410001struct tag {struct tag_header hdr;union {struct tag_core		core;struct tag_mem32	mem;struct tag_videotext	videotext;struct tag_ramdisk	ramdisk;struct tag_initrd	initrd;struct tag_serialnr	serialnr;struct tag_revision	revision;struct tag_videolfb	videolfb;struct tag_cmdline	cmdline;/** Acorn specific*/struct tag_acorn	acorn;/** DC21285 specific*/struct tag_memclk	memclk;} u;
};#define tag_next(t)	((struct tag *)((u32 *)(t) + (t)->hdr.size))
#define tag_size(type)	((sizeof(struct tag_header) + sizeof(struct type)) >> 2)/*first tag is ATAG_CORE*/
static void setup_start_tag (bd_t *bd)
{params = (struct tag *) bd->bi_boot_params;params->hdr.tag = ATAG_CORE;params->hdr.size = tag_size (tag_core);params->u.core.flags = 0;params->u.core.pagesize = 0;params->u.core.rootdev = 0;params = tag_next (params);
}/*end tag is ATAG_NONE*/
static void setup_end_tag (bd_t *bd)
{params->hdr.tag = ATAG_NONE;params->hdr.size = 0;
}/*all tag assigned as bellow, use tag_next to point next tag's address*/
void setup_serial_tag (struct tag **tmp)
{struct tag *params = *tmp;struct tag_serialnr serialnr;void get_board_serial(struct tag_serialnr *serialnr);get_board_serial(&serialnr);params->hdr.tag = ATAG_SERIAL;params->hdr.size = tag_size (tag_serialnr);params->u.serialnr.low = serialnr.low;params->u.serialnr.high= serialnr.high;params = tag_next (params);*tmp = params;
}

不清楚这块的可以先看一下前一篇博客。所有的参数都是以一个struct tag的结构给出,第一个tag的名称为ATAG_CORE,最后一个tag的名称为ATAG_NONE,其中的每个tag的赋值都类似于setup_serial_tag函数,对tag内容进行赋值,然后调用tag_next指向下一个tag地址。

 

其实内核中也保存了同样一份struct tag声明,在linux源码根目录/arch/arm/include/asm的setup.h中。

③校验参数的过程

#define ATAG_CORE 0x54410001
#define ATAG_CORE_SIZE ((2*4 + 3*4) >> 2)
#define ATAG_CORE_SIZE_EMPTY ((2*4) >> 2)#ifdef CONFIG_CPU_BIG_ENDIAN
#define OF_DT_MAGIC 0xd00dfeed
#else
#define OF_DT_MAGIC 0xedfe0dd0 /* 0xd00dfeed in big-endian */
#endif__vet_atags:tst	r2, #0x3			@ aligned?bne	1fldr	r5, [r2, #0]
#ifdef CONFIG_OF_FLATTREEldr	r6, =OF_DT_MAGIC		@ is it a DTB?cmp	r5, r6beq	2f
#endifcmp	r5, #ATAG_CORE_SIZE		@ is first tag ATAG_CORE?cmpne	r5, #ATAG_CORE_SIZE_EMPTYbne	1fldr	r5, [r2, #4]ldr	r6, =ATAG_COREcmp	r5, r6bne	1f2:	mov	pc, lr				@ atag/dtb pointer is ok1:	mov	r2, #0mov	pc, lr

首先,r2中保存的就是bd->bi_boot_params即tag在内存中保存的首地址,校验r2是否为四字节对齐;

然后,将r2中的内容取出保存在r5,即r5为第一个tag(ATAG_CORE)的struct tag_header中的size;

然后,比较r5是否与u-boot传入的tag_size (tag_core)的大小相等;

最后,比较第一个tag是否为ATAG_CORE。

当条件全部满足后返回,r2仍为bd->bi_boot_params=DDR地址+0x100=0x80000100,否则r2=0

(4)创建一级页表

①“初始化”工作

.macro	pgtbl, rd, physadd	\rd, \phys, #TEXT_OFFSET - 0x4000.endm__create_page_tables:pgtbl	r4, r8				@ page table address/** Clear the 16K level 1 swapper page table*/mov	r0, r4mov	r3, #0add	r6, r0, #0x4000
1:	str	r3, [r0], #4str	r3, [r0], #4str	r3, [r0], #4str	r3, [r0], #4teq	r0, r6bne	1bldr	r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags

 

由之前寄存器中存放的值,可以知道,r8=RAM的起始物理地址(0x80000000),r4=物理地址-虚拟地址,且链接器脚本指明了TEXT_OFFSET=0x00008000,那么把pgtbl的宏展开即为r4 = r8 + TEXT_OFFSET - 0x4000 = 0x80004000,这一步主要是声明了将内核代码的前16K大小用于存放页表,并将之清0。而ldr指令的作用,结合定义于linux源码根目录/arch/arm/kernel下的asm-offsets.c来看

 

DEFINE(PROCINFO_MM_MMUFLAGS,	offsetof(struct proc_info_list, __cpu_mm_mmu_flags));

可以知道,r10中保存的是与process id相符的proc_info_list结构,这里取出的是proc_info_list结构中的__cpu_mm_mmu_flags成员,最后将这个值从proc-v7.S中重新找出来发现,无论是__v7_ca9mp_proc_info还是__v7_proc_info,这个字段都是一样的,为

ALT_SMP(.long \PMD_TYPE_SECT | \PMD_SECT_AP_WRITE | \PMD_SECT_AP_READ | \PMD_FLAGS_SMP)

展开后即为(2<<0) | (1<<10) | (1<<11) | (1<<16) | (1<<12) | (1<<3) | (1<<2) = 0x00011c0e,将这个值保存到r7寄存器中,这个值具体含义可以先看后面对这个值的操作情况。

②MMU使能代码对应的页表转换

adr	r0, __enable_mmu_locldmia	r0, {r3, r5, r6}sub	r0, r0, r3			@ virt->phys offsetadd	r5, r5, r0			@ phys __enable_mmuadd	r6, r6, r0			@ phys __enable_mmu_endmov	r5, r5, lsr #20mov	r6, r6, lsr #201:	orr	r3, r7, r5, lsl #20		@ flags + kernel basestr	r3, [r4, r5, lsl #2]		@ identity mappingteq	r5, r6addne	r5, r5, #1			@ next sectionbne	1b__enable_mmu_loc:.long	..long	__enable_mmu.long	__enable_mmu_end

这一步主要是将__enable_mmu这个标号中的代码建立虚拟地址的页表转换,这样做的目的如下:

因为开启MMU之前,pc的地址是物理地址(为什么?因为自从u-boot中执行了ldr pc, _start_armboot后,pc指针就一直是RAM中的实际物理地址),是0x80008000之后的某个地址,而开启之后,如果没有特殊的操作,地址也会是0x80008000之后的某个地址,但是此时的地址会被认为是虚拟地址,如果不对这部分虚拟地址建立页表,程序会立马出现问题。

操作过程:

这里前五行和之前虚拟地址-物理地址的转换方式如出一辙,不再赘述,主要是将__enable_mmu(一个标号的地址,用于初始化MMU)和__enable_mmu_end转换为物理地址分别保存于r5和r6寄存器中,然后将r5左移20位即取出r5的高12位,这个操作主要因为段式页表(因为0x00011c0e的最低两位为10)的建立是每一个表项转换1M的空间,页表具体格式如下(参见ARM体系结构与编程.pdf):

 

 

在页表格式的基础之上,再来理解之前r7 = 0x00011c0e的含义,以及orr r3, r7, r5, lsl #20的作用就不难了,因为是1:1的映射关系,所以段基地址即为物理地址。而str r3, [r4, r5, lsl #2]左移两位的原因,也和段地址的变换过程有关:

第一个地址,页表的基地址为0x80004000;

第二个地址,一级页表内的偏移序号,即为r5>>20后的结果,段内地址的偏移量(0x00000000~0x000fffff);

第三个地址,页表项存放的位置,是页表的基地址r4=0x80004000加上(r5>>20后的结果再左移两位);

第四个地址,页表项中存放的值,是段对应的物理基地址(r5>>20)<<20,或上__cpu_mm_mmu_flags = 0x00011c0e;

第五个地址,虚拟地址的对应值。

MMU这部分页表建立完成之后,对应关系如下:

③Kernel代码对应的页表转换

#define KERNEL_RAM_VADDR	(PAGE_OFFSET + TEXT_OFFSET)
#define KERNEL_START	KERNEL_RAM_VADDR
#define KERNEL_END	_endmov	r3, pcmov	r3, r3, lsr #20orr	r3, r7, r3, lsl #20add	r0, r4,  #(KERNEL_START & 0xff000000) >> 18str	r3, [r0, #(KERNEL_START & 0x00f00000) >> 18]!ldr	r6, =(KERNEL_END - 1)add	r0, r0, #4add	r6, r4, r6, lsr #18
1:	cmp	r0, r6add	r3, r3, #1 << 20strls	r3, [r0], #4bls	1b

在了解了之前的__enable_mmu转换过程之后,这部分就比较好理解了,只是此处处理的是pc指针罢了。但比较奇怪的是KERNEL_START为什么只取了前8位并只右移了18位,而之前是右移20位,且最后赋值到对应地址时也没有了左移两位,其实想想后发现算法并没有变化,只是换了一种写法:右移18位后保证少移了两位,且最后两位是0,但由于只取了前8位,会丢失4位,所以赋值时会把这四位的值直接加上。还有一点需要注意的是,内核虚拟地址的起点很简单,是链接脚本中的PAGE_OFFSET+TEXT_OFFSET=0xC0000000+0x00008000,但是终点呢?也需要看链接器脚本中的

_end = .;

而且,页表转换颗粒度永远都是1M,所以_end不是1M对齐时,也会将1M的位置补齐保证中间的虚拟地址都能正常转换为物理地址(和__enable_mmu的转换类似,代码不足1M也会补齐1M的转换页表)。最终Kernel转换后,对应关系如下:

④bootargs对应的页表转换

mov	r0, r2, lsr #20movs	r0, r0, lsl #20moveq	r0, r8sub	r3, r0, r8add	r3, r3, #PAGE_OFFSETadd	r3, r4, r3, lsr #18orr	r6, r7, r0str	r6, [r3]

方法类似,不再赘述,读者可自行推解这个过程。

(5)保存最后的跳转地址,设置处理器和MMU相关寄存器

ldr	r13, =__mmap_switched		@ address to jump to after@ mmu has been enabledadr	lr, BSYM(1f)			@ return (PIC) addressmov	r8, r4				@ set TTBR1 to swapper_pg_dirARM(	add	pc, r10, #PROCINFO_INITFUNC	)THUMB(	add	r12, r10, #PROCINFO_INITFUNC	)THUMB(	mov	pc, r12				)
1:	b	__enable_mmu

这里主要注意__mmap_switched其实此时是链接地址的值,即0xC0008000之后的一个地址,最后跳转后由于已经映射了内核部分的代码,这部分可以正常运行,若这之前没有映射,之后mov pc, r13将跑飞。还有一点:

THUMB(	add	r12, r10, #PROCINFO_INITFUNC	)THUMB(	mov	pc, r12				)

这两句,比较容易被忽视,一旦忽视了,后面的__enable_mmu以及__turn_mmu_on就会对r0寄存器存在疑问,为什么其中保存的是协处理器的值。首先,通过r10是对应的proc_info_list结构,取出它的PROCINFO_INITFUNC成员即__cpu_flush函数指针,值为__v7_ca9mp_setup(proc-v7.S中可以找到)

__v7_ca9mp_setup:
#ifdef CONFIG_SMPALT_SMP(mrc	p15, 0, r0, c1, c0, 1)ALT_UP(mov	r0, #(1 << 6))		@ fake it for UPtst	r0, #(1 << 6)			@ SMP/nAMP mode enabled?orreq	r0, r0, #(1 << 6) | (1 << 0)	@ Enable SMP/nAMP mode andmcreq	p15, 0, r0, c1, c0, 1		@ TLB ops broadcasting
#endif
__v7_setup:adr	r12, __v7_setup_stack		@ the local stackstmia	r12, {r0-r5, r7, r9, r11, lr}bl	v7_flush_dcache_allldmia	r12, {r0-r5, r7, r9, r11, lr}mrc	p15, 0, r0, c0, c0, 0		@ read main ID registerand	r10, r0, #0xff000000		@ ARM?teq	r10, #0x41000000bne	3fand	r5, r0, #0x00f00000		@ variantand	r6, r0, #0x0000000f		@ revisionorr	r6, r6, r5, lsr #20-4		@ combine variant and revisionubfx	r0, r0, #4, #12			@ primary part number/* Cortex-A9 Errata */
2:	ldr	r10, =0x00000c09		@ Cortex-A9 primary part numberteq	r0, r10bne	3f
#ifdef CONFIG_ARM_ERRATA_742230cmp	r6, #0x22			@ only present up to r2p2mrcle	p15, 0, r10, c15, c0, 1		@ read diagnostic registerorrle	r10, r10, #1 << 4		@ set bit #4mcrle	p15, 0, r10, c15, c0, 1		@ write diagnostic register
#endif
#ifdef CONFIG_ARM_ERRATA_742231teq	r6, #0x20			@ present in r2p0teqne	r6, #0x21			@ present in r2p1teqne	r6, #0x22			@ present in r2p2mrceq	p15, 0, r10, c15, c0, 1		@ read diagnostic registerorreq	r10, r10, #1 << 12		@ set bit #12orreq	r10, r10, #1 << 22		@ set bit #22mcreq	p15, 0, r10, c15, c0, 1		@ write diagnostic register
#endif
#ifdef CONFIG_ARM_ERRATA_743622teq	r6, #0x20			@ present in r2p0teqne	r6, #0x21			@ present in r2p1teqne	r6, #0x22			@ present in r2p2mrceq	p15, 0, r10, c15, c0, 1		@ read diagnostic registerorreq	r10, r10, #1 << 6		@ set bit #6mcreq	p15, 0, r10, c15, c0, 1		@ write diagnostic register
#endif
#ifdef CONFIG_ARM_ERRATA_751472cmp	r6, #0x30			@ present prior to r3p0mrclt	p15, 0, r10, c15, c0, 1		@ read diagnostic registerorrlt	r10, r10, #1 << 11		@ set bit #11mcrlt	p15, 0, r10, c15, c0, 1		@ write diagnostic register
#endif3:	mov	r10, #0
#ifdef HARVARD_CACHEmcr	p15, 0, r10, c7, c5, 0		@ I+BTB cache invalidate
#endifdsb
#ifdef CONFIG_MMUmcr	p15, 0, r10, c8, c7, 0		@ invalidate I + D TLBsmcr	p15, 0, r10, c2, c0, 2		@ TTB control registerALT_SMP(orr	r4, r4, #TTB_FLAGS_SMP)ALT_UP(orr	r4, r4, #TTB_FLAGS_UP)ALT_SMP(orr	r8, r8, #TTB_FLAGS_SMP)ALT_UP(orr	r8, r8, #TTB_FLAGS_UP)mcr	p15, 0, r8, c2, c0, 1		@ load TTB1ldr	r5, =PRRR			@ PRRRldr	r6, =NMRR			@ NMRRmcr	p15, 0, r5, c10, c2, 0		@ write PRRRmcr	p15, 0, r6, c10, c2, 1		@ write NMRR
#endifadr	r5, v7_crvalldmia	r5, {r5, r6}
#ifdef CONFIG_CPU_ENDIAN_BE8orr	r6, r6, #1 << 25		@ big-endian page tables
#endif
#ifdef CONFIG_SWP_EMULATEorr     r5, r5, #(1 << 10)              @ set SW bit in "clear"bic     r6, r6, #(1 << 10)              @ clear it in "mmuset"
#endifmrc	p15, 0, r0, c1, c0, 0		@ read control registerbic	r0, r0, r5			@ clear bits themorr	r0, r0, r6			@ set themTHUMB(	orr	r0, r0, #1 << 30	)	@ Thumb exceptionsmov	pc, lr				@ return to head.S:__ret
ENDPROC(__v7_setup)/*   AT*  TFR   EV X F   I D LR    S* .EEE ..EE PUI. .T.T 4RVI ZWRS BLDP WCAM* rxxx rrxx xxx0 0101 xxxx xxxx x111 xxxx < forced*    1    0 110       0011 1100 .111 1101 < we want*/.type	v7_crval, #object
v7_crval:crval	clear=0x0120c302, mmuset=0x10c03c7d, ucset=0x00c01c7c__v7_setup_stack:.space	4 * 11				@ 11 registers

在设置了处理器相关的寄存器后,adr r5, v7_crval和ldmia r5, {r5, r6},把需要屏蔽的bit位和需要设置的bit位保存在了r5=0x0120c302和r6=0x10c03c7d中,紧接着读出了cp15协处理器中的c1寄存器到r0,将r5中的位清掉,r6中的位设置上(注意MMU_ENABLE位bit0也在此处被设置上了),之后的使能就围绕了r0进行了其他位操作,最终将赋值好的r0写回cp15的c1寄存器即可。

(6)使能MMU

__enable_mmu:
#ifdef CONFIG_ALIGNMENT_TRAPorr	r0, r0, #CR_A
#elsebic	r0, r0, #CR_A
#endif
#ifdef CONFIG_CPU_DCACHE_DISABLEbic	r0, r0, #CR_C
#endif
#ifdef CONFIG_CPU_BPREDICT_DISABLEbic	r0, r0, #CR_Z
#endif
#ifdef CONFIG_CPU_ICACHE_DISABLEbic	r0, r0, #CR_I
#endifmov	r5, #(domain_val(DOMAIN_USER, DOMAIN_MANAGER) | \domain_val(DOMAIN_KERNEL, DOMAIN_MANAGER) | \domain_val(DOMAIN_TABLE, DOMAIN_MANAGER) | \domain_val(DOMAIN_IO, DOMAIN_CLIENT))mcr	p15, 0, r5, c3, c0, 0		@ load domain access registermcr	p15, 0, r4, c2, c0, 0		@ load page table pointerb	__turn_mmu_on

主要是设置协处理器p15的c2和c3寄存器,在ARM体系结构与编程.pdf中也有所说明:

之前设置的所有页表地址还有地址中保存的值,最终将页表的首地址r4寄存器赋值给c2寄存器后,MMU就能够根据这个关系来转换虚拟地址和物理地址了。至于开启MMU的操作就很简单了

__turn_mmu_on:mov	r0, r0mcr	p15, 0, r0, c1, c0, 0		@ write control regmrc	p15, 0, r3, c0, c0, 0		@ read id regmov	r3, r3mov	r3, r13mov	pc, r3

只需要操作cp15的c1寄存器即可(ARM体系结构与编程.pdf中也有)

在使能后的跳转便可以用到r13寄存器了(ldr r13, =__mmap_switched)

(7)head.S的终点

/** The following fragment of code is executed with the MMU on in MMU mode,* and uses absolute addresses; this is not position independent.**  r0  = cp#15 control register*  r1  = machine ID*  r2  = atags/dtb pointer*  r9  = processor ID*/__INIT
__mmap_switched:adr	r3, __mmap_switched_dataldmia	r3!, {r4, r5, r6, r7}cmp	r4, r5				@ Copy data segment if needed
1:	cmpne	r5, r6ldrne	fp, [r4], #4strne	fp, [r5], #4bne	1bmov	fp, #0				@ Clear BSS (and zero fp)
1:	cmp	r6, r7strcc	fp, [r6],#4bcc	1bARM(	ldmia	r3, {r4, r5, r6, r7, sp})THUMB(	ldmia	r3, {r4, r5, r6, r7}	)THUMB(	ldr	sp, [r3, #16]		)str	r9, [r4]			@ Save processor IDstr	r1, [r5]			@ Save machine typestr	r2, [r6]			@ Save atags pointerbic	r4, r0, #CR_A			@ Clear 'A' bitstmia	r7, {r0, r4}			@ Save control register valuesb	start_kernel__mmap_switched_data:.long	__data_loc			@ r4.long	_sdata				@ r5.long	__bss_start			@ r6.long	_end				@ r7.long	processor_id			@ r4.long	__machine_arch_type		@ r5.long	__atags_pointer			@ r6.long	cr_alignment			@ r7.long	init_thread_union + THREAD_START_SP @ sp.size	__mmap_switched_data, . - __mmap_switched_data

__mmap_switched完成的工作如下: 

(1)如果有必要则进行data段的拷贝搬移 

结合链接脚本可知,拷贝过程为,将__data_loc到_sdata的间数据拷贝到_sdata到__bss_start段。

(2)清空bss段及fp指针

将__bss_start到_end之间的数据清零,cmp r6,r7(比较r6,r7,若r6<r7则C=0,用之后的'cc'可进行判断C是否为0拷贝和跳转)。

(3)将r9中保存的处理器ID、r1中保存的machid、r2中保存的bi_boot_params、r0中保存的cp15控制寄存器拷贝到processor_id、__machine_arch_type、__atags_pointer、cr_alignment等全局变量中,并设置sp指针为init_thread_union + THREAD_START_SP,init_thread_union代表的是内核第一个进程,pid = 0,该进程是内核人为造出来的,而不是fork出来的,在linux源码根目录/arch/arm/kernel/的init_task.c中定义了该进程

/**  linux/arch/arm/kernel/init_task.c*/
#include <linux/mm.h>
#include <linux/module.h>
#include <linux/fs.h>
#include <linux/sched.h>
#include <linux/init.h>
#include <linux/init_task.h>
#include <linux/mqueue.h>
#include <linux/uaccess.h>#include <asm/pgtable.h>static struct signal_struct init_signals = INIT_SIGNALS(init_signals);
static struct sighand_struct init_sighand = INIT_SIGHAND(init_sighand);
/** Initial thread structure.** We need to make sure that this is 8192-byte aligned due to the* way process stacks are handled. This is done by making sure* the linker maps this in the .text segment right after head.S,* and making head.S ensure the proper alignment.** The things we do for performance..*/
union thread_union init_thread_union __init_task_data ={ INIT_THREAD_INFO(init_task) };/** Initial task structure.** All other task structs will be allocated on slabs in fork.c*/
struct task_struct init_task = INIT_TASK(init_task);EXPORT_SYMBOL(init_task);

其中定义了THREAD_SIZE(8KB)的静态栈空间,__mmap_switched将sp设置在了内核第一进程的栈顶部,栈向下生长,因此接下来start_kernel就运行在该内核栈。 直到rest_init中调用kernel_thread创建进程kernel_init(kernel_init的pid = 1)。

(4)跳转到start_kernel

__mmap_switched最后跳转到start_kernel开始进入C函数运行环境,这时整个kernel image已经运行在虚拟地址之上,运行地址 链接地址保持了一致,内核运行进入了新时代!

这篇关于Hi3520D上手过程之Kernel前段学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/209299

相关文章

SpringBoot 整合 Grizzly的过程

《SpringBoot整合Grizzly的过程》Grizzly是一个高性能的、异步的、非阻塞的HTTP服务器框架,它可以与SpringBoot一起提供比传统的Tomcat或Jet... 目录为什么选择 Grizzly?Spring Boot + Grizzly 整合的优势添加依赖自定义 Grizzly 作为

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d

springboot整合gateway的详细过程

《springboot整合gateway的详细过程》本文介绍了如何配置和使用SpringCloudGateway构建一个API网关,通过实例代码介绍了springboot整合gateway的过程,需要... 目录1. 添加依赖2. 配置网关路由3. 启用Eureka客户端(可选)4. 创建主应用类5. 自定

最新版IDEA配置 Tomcat的详细过程

《最新版IDEA配置Tomcat的详细过程》本文介绍如何在IDEA中配置Tomcat服务器,并创建Web项目,首先检查Tomcat是否安装完成,然后在IDEA中创建Web项目并添加Web结构,接着,... 目录配置tomcat第一步,先给项目添加Web结构查看端口号配置tomcat    先检查自己的to

SpringBoot集成SOL链的详细过程

《SpringBoot集成SOL链的详细过程》Solanaj是一个用于与Solana区块链交互的Java库,它为Java开发者提供了一套功能丰富的API,使得在Java环境中可以轻松构建与Solana... 目录一、什么是solanaj?二、Pom依赖三、主要类3.1 RpcClient3.2 Public

Android数据库Room的实际使用过程总结

《Android数据库Room的实际使用过程总结》这篇文章主要给大家介绍了关于Android数据库Room的实际使用过程,详细介绍了如何创建实体类、数据访问对象(DAO)和数据库抽象类,需要的朋友可以... 目录前言一、Room的基本使用1.项目配置2.创建实体类(Entity)3.创建数据访问对象(DAO

SpringBoot整合kaptcha验证码过程(复制粘贴即可用)

《SpringBoot整合kaptcha验证码过程(复制粘贴即可用)》本文介绍了如何在SpringBoot项目中整合Kaptcha验证码实现,通过配置和编写相应的Controller、工具类以及前端页... 目录SpringBoot整合kaptcha验证码程序目录参考有两种方式在springboot中使用k

SpringBoot整合InfluxDB的详细过程

《SpringBoot整合InfluxDB的详细过程》InfluxDB是一个开源的时间序列数据库,由Go语言编写,适用于存储和查询按时间顺序产生的数据,它具有高效的数据存储和查询机制,支持高并发写入和... 目录一、简单介绍InfluxDB是什么?1、主要特点2、应用场景二、使用步骤1、集成原生的Influ

SpringBoot实现websocket服务端及客户端的详细过程

《SpringBoot实现websocket服务端及客户端的详细过程》文章介绍了WebSocket通信过程、服务端和客户端的实现,以及可能遇到的问题及解决方案,感兴趣的朋友一起看看吧... 目录一、WebSocket通信过程二、服务端实现1.pom文件添加依赖2.启用Springboot对WebSocket

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert