[嵌入式系统-40]:龙芯1B 开发学习套件 -10-PMON启动过程start.S详解

本文主要是介绍[嵌入式系统-40]:龙芯1B 开发学习套件 -10-PMON启动过程start.S详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、龙芯向量表与启动程序的入口(复位向量)

1.1 复位向量:

1.2 代码执行流程

1.3 计算机的南桥 VS 北桥

二、PMON代码执行流程

三、Start.S详解

3.1 CPU初始化时所需要的宏定义

(1)与CPU相关的一些宏定义有

(2)编译指示

(3)程序入口指示

(4)第一条可执行的指令

(5)确保在uncache的地址空间运行代码,而不是在Cache地址空间运行代

(6)异常向量

3.2 异常向量

3.3 初始化内存

3.4 内存地址修正

3.5 初始化北桥和串口

3.6 初始化E2PROM,并且读取E2PROM参数

3.7 初始化Cache

3.8 PMON自身从ROM中拷贝到RAM(在Cache之后)

3.9 汇编到C语言

它山之石:


一、龙芯向量表与启动程序的入口(复位向量)

1.1 复位向量:

当整个板子起电后,CPU将从 0xBFC00000 取指令开始执行,而ROM在系统中的地址就是从该地址开始的。所以,其中0xBFC00000 处的第一条指令就是整个过程中 CPU 要执行的第一个指令

+++++++++++++++++++++++++++++++++++++++++

1.2 代码执行流程

+++++++++++++++++++++++++++++++++++++++++

  • 初始化CPU内的寄存器,清TLB. 
  • 初始化一些北桥的基本配置,以确保uart能够正常工作. 
  • 初始化uart,主要是设置波特率. 
  • 初始化内存DDR RAM(主要通过I2C协议从内存自带的EEPROM读取内存参数来进行设置). 
  • 初始化cache. 
  • 拷贝ROM中的pmon的代码到内存DDRM,然后通过 
  • la      v0, initmips
  • jalr    v0
  • nop
  • 从此代码便到内存中间去了,从这开始因为可以读写内存,所以有了栈,故可以用C的代码了,所以以后的程序便是C代码了

1.3 计算机的南桥 VS 北桥

南桥和北桥是早期计算机系统中的两个主要组件,它们起着连接和协调计算机内部各部件工作的重要作用。它们的功能在现代计算机体系结构中已经被集成到了更复杂的芯片组中,因此南桥和北桥的区分已经不那么明显了。不过,我们可以回顾一下它们的基本概念:

  1. 北桥(Northbridge)

    • 北桥是计算机系统中的一种芯片组件,通常位于主板上,靠近 CPU。
    • 它负责处理与高速组件的连接,例如内存(RAM)、图形处理器(GPU)和一些扩展插槽(例如PCI Express)。
    • 在早期计算机系统中,北桥也负责处理内存控制器功能,但随着技术的发展,内存控制器已经被集成到了 CPU 中,因此这个功能已经不再需要。
  2. 南桥(Southbridge)

    • 南桥也是一种芯片组件,通常位于主板上,相对于北桥位置更靠近外部连接端口(如USB、SATA、网络端口等)。
    • 它负责管理和控制低速设备的连接,例如硬盘驱动器、键盘、鼠标和其他外围设备。
    • 南桥也负责处理一些I/O功能,例如PCI总线、USB控制器等。

总的来说,北桥和南桥在早期计算机系统中扮演了连接和协调内部各个组件的角色,但随着技术的发展,这些功能已经被整合到更复杂的芯片组中,而不再是单独的北桥和南桥芯片。

二、PMON代码执行流程

当整个板子起电或复位异常后,CPU将从 0xBFC00000 取指令开始执行,而ROM在系统中的地址就是从该地址开始的。所以,ROM的第一条指令就是整个过程中 CPU 要执行的第一个指令。

  • 初始化CPU内的寄存器,清TLB.
  • 初始化一些北桥的基本配置,以确保uart能够正常工作.
  • 初始化uart,主要是设置波特率.
  • 初始化内存(主要通过I2C协议从内存的EEPROM读取内存参数来进行设置).
  • 初始化cache.
  • 拷贝pmon的代码到内存,然后通过
la      v0, initmips
jalr    v0
nop从此代码便到内存中间去了,从这开始因为可以读写内存,所以有了栈,故可以用C的代码了,所以以后的程序便是C代码了.

三、Start.S详解

3.1 CPU初始化时所需要的宏定义

start.S文件在 /Targets/Bonito/Bonito 目录当中,是整个PMON代码的起点。我们首先研究它。

文件一开头是版权声明部分,然后是包括一些头文件,然后是一些宏定义,然后才是代码。

(1)与CPU相关的一些宏定义有

/**   Register usage:**    s0    link versus load offset, used to relocate absolute adresses.*    s1    free*    s2    memory size.*    s3    free.*    s4    Bonito base address.*    s5    dbg.*    s6    sdCfg.*    s7    rasave.*    s8    L3 Cache size.*/#define tmpsize        s1
#define msize        s2
#define bonito        s4
#define dbg            s5
#define sdCfg        s6

(2)编译指示

下面是程序的开头,不过并不生成实际的二进制数据,它告诉编译汇编器一些信息。

.set    noreorder
    .globl    _start
    .globl    start
    .globl    __main

(3)程序入口指示

_start:   //程序入口标识
start:
    .globl    stack
    stack = start - 0x4000         /* Place PMON stack below PMON start in RAM */

=====================
解释:
.set noreorder
是告诉汇编汇编器不要对后面的代码进行优化处理,比如重新排列执行代码。

.globl _start
.globl start
.globl __main
这里,定义了三个全局符号。可以PMON代码中的任何地方引用它。

_start:
start:
.globl stack
stack = start - 0x4000 /* Place PMON stack below PMON start in RAM */
在这里定义了子程序的名称 _start 和 start。
并定义了堆栈的栈底 stack 值,在 start 以下 16K 处。栈地址通常在RAM中,而不是ROM中。
这里的代码说明:

-- 启动前,RAM的地址空间在ROM的地址空间一下.

-- RAM地址空间的最高处保留了16K的地址空间用于系统堆栈
=====================

栈(Stack)是计算机科学中一种基本的数据结构,它是一种先进后出(Last In, First Out,LIFO)的数据结构。栈通常用于存储临时数据以及函数调用的上下文信息。

栈的特点包括:

  1. 后进先出(LIFO):最后存入栈的数据项首先被取出。这是栈的基本原则,也是它与其他数据结构(如队列)的主要区别之一。

  2. 压栈(Push):将数据项放入栈顶的操作称为压栈。新的数据项被添加到栈顶,使其成为栈的新顶部。

  3. 弹栈(Pop):从栈顶移除数据项的操作称为弹栈。弹栈操作会移除栈顶的数据项,并将栈顶指针向下移动。

  4. 栈顶指针:栈顶指针是指向栈顶元素的位置的指针,它指示了下一个压入栈的元素应该存放的位置,同时也指示了下一个弹出的元素是什么。

栈在计算机科学中有广泛的应用,包括但不限于:

  • 函数调用:每当调用一个函数时,其局部变量和返回地址会被压入栈中,函数执行完毕后再从栈中弹出这些信息。

  • 表达式求值:在编译器和解释器中,栈常用于表达式求值,特别是中缀表达式转换为后缀表达式以及后缀表达式的计算。

  • 内存管理:栈还被用于内存管理,例如函数调用栈可以用来跟踪内存分配和释放。

  • 递归:递归函数调用时,每一层递归调用都会在栈上创建一个新的帧,递归结束后这些帧会依次从栈中弹出。

总之,栈是一种非常重要的数据结构,它在计算机科学中有着广泛的应用。

(4)第一条可执行的指令

下面是程序执行的第一条语句

/* NOTE!! Not more that 16 instructions here!!! Right now it's FULL! */mtc0    zero, COP_0_STATUS_REG  //清除CP0状态寄存器mtc0    zero, COP_0_CAUSE_REG   //清除CP0原因寄存器li    t0, SR_BOOT_EXC_VEC        /* 这是一个加载立即数的指令:Exception to Boostrap Location */                                mtc0    t0, COP_0_STATUS_REG/* SR's BEV bit is set so the CPU uses the ROM(kseg1) space exception entry point when reboot exception occursla    sp, stack                la    gp, _gp                =====================        
解释:
由于龙芯的地址空间决定,这里的代码不能超过0x100,即256字节,因为后面紧跟着的是中断向量的地址。接着,就把 CP0 的状态寄存器 COP_0_STATUS_REG 和 COP_0_CAUSE_REG 寄存器全部清空为0。
li t0, SR_BOOT_EXC_VEC
接着设置状态寄存器的BEV位,这样就是让 CP0 运行在没有 TLB 的模式,并且一旦发生异常,
就进入ROM 的 bfc00000 位置重启。后面两句主要设置引导程序的堆栈空间,
la sp, stack 是把栈底地址给 sp 寄存器,
la gp, _gp 是把编译器中的 _gp 全局地址给 gp 寄存器,这样做法是让全局变量可以作相对寄存器寻址。
其中_gp是在连接脚本文件里定义的。Exception to Bootstrap Location” 是一个描述异常处理程序应该跳转到的引导位置的术语。在计算机系统中,当发生异常(如内存访问错误、除以零等)时,系统需要知道应该执行哪些操作来处理这些异常。因此,程序员会设置一个异常处理程序,用于处理不同类型的异常情况。“Boostrap Location” 可以理解为引导程序的位置,即系统启动时执行的第一个位置。在异常发生时,系统可能需要跳转到引导位置,以便进行异常处理或其他必要的操作。因此,“Exception to Boostrap Location” 可以被理解为设置异常处理程序应该跳转到的系统引导位置。这在上下文中通常用于设置异常向引导位置注册,以确保在发生异常时能够正确地处理异常情况并返回到引导位置进行进一步处理。
=====================

(5)确保在uncache的地址空间运行代码,而不是在Cache地址空间运行代

#define KUSEG_ADDR        0x0
#define CACHED_MEMORY_ADDR    0x80000000
#define UNCACHED_MEMORY_ADDR    0xa0000000
#define KSEG2_ADDR        0xc0000000
#define MAX_MEM_ADDR        0xbe000000
#define    RESERVED_ADDR        0xbfc80000

bal    uncached
nop
bal    locate
nop    uncached:
or      ra, UNCACHED_MEMORY_ADDR
j    ra
nop=====================        
解释:
这段程序先进行一个无条件跳转连接指令,这样做的目的很明确就是想清空预取指令和流水线的指令。
这样就跳到 uncached 这里运行。
先来看看bal指令会做些什么事情,
通常bal指令会算出跳转到的目的地址相对于PC寄存器的偏移量,
然后把PC+8指令地址放到ra寄存器里,也就是把bal locate指令地址放到RA寄存器,以便可以返回。由于龙芯2E的加电时启动地址是 0xBFC0 0000,那么放在ra里的值就是 0xBFCO 0028(第8条指令)。
后面
or ra, UNCACHED_MEMORY_ADDR,这里进行是与0xA000 00000的或运算,
也就是说从ROM加载时,不会改变返回地址 ra 的值。
写这句的目的主要是保证要从ROM中运行后面的一段程序,而不是从其它地址(RAM中)运行。
所以接着就跳回来到 bal locate位置并执行 bal locate 指令,这样就跳到 locate 的位置执行程序了。
=====================

(6)异常向量

在MIPS中,异常处理入口有两套,通过 CP0 的 STATUS 寄存器位 BEV 来决定,

当 BEV=1 时,异常的入口地址为 0xBFC00000 开始的地址。

而 BEV=0,异常地址为 0x80000000 开始的地址,

所以PMON程序段开始处是一些异常的调入口,需要跳过这段空间,

程序就是通过这个 bal 指令跳到后面的

pmon-exception-vector.png

3.2 异常向量

下面是那段被跳过去的异常代码

/**  Reboot vector usable from outside pmon. *//* started in aligned address by 2^8=256 Bytes, that is 0xbfc00000 + 0x100 = 0xbfc00100 */.align    8                        
ext_map_and_reboot:bal    CPU_TLBClear                nopli    a0, 0xc0000000li    a1, 0x40000000bal    CPU_TLBInitnopla    v0, tgt_reboot                la    v1, start                    subu    v0, v1                    lui    v1, 0xffc0                    addu    v0, v1jr    v0nop/**  Exception vectors here for rom, before we are up and running. Catch*  whatever comes up before we have a fully fledged exception handler.*//* TLB refill exception *//* bfc00200, this code address is 0xbfc00200, 2^9 = 512 Bytes, it is a exception process function */.align    9            move    k0, ra            /* save ra */la    a0, v200_msgbal    stringserialnopb    exc_common.align    7            /* bfc00280 */move    k0, ra    #save rala    a0, v280_msgbal    stringserialnopb    exc_common        // print the CP0 register's infomation/* Cache error handler */.align    8            /* bfc00300 */PRINTSTR("\r\nPANIC! Unexpected Cache Error exception! ")mfc0    a0, COP_0_CACHE_ERRbal    hexserialnopb    exc_common/* General exception handler */.align    7            /* bfc00380 */move    k0, ra    #save rala    a0, v380_msgbal    stringserialnopb    exc_common.align    8            /* bfc00400 */move    k0, ra    #save rala    a0, v400_msgbal    stringserialnop/* when the exception occurs, do this code to present the CP0 register's content */
exc_common:PRINTSTR("\r\nCAUSE=")mfc0    a0, COP_0_CAUSE_REGbal    hexserialnopPRINTSTR("\r\nSTATUS=")mfc0    a0, COP_0_STATUS_REGbal    hexserialnopPRINTSTR("\r\nERRORPC=")mfc0    a0, COP_0_ERROR_PCbal    hexserialnopPRINTSTR("\r\nEPC=")mfc0    a0, COP_0_EXC_PCbal    hexserialnopPRINTSTR("\r\nBADVADDR=")mfc0    a0, COP_0_BAD_VADDRbal    hexserialnopPRINTSTR("\r\nRA=")move    a0, k0bal    hexserialnop//    b    ext_map_and_rebootnop/* control the distribution of the code, here we insert a bank 256 Bytes. */.align 8    nop/* handler name table */.align 8.word read.word write.word open.word close.word nullfunction.word printf.word vsprintf.word nullfunction.word nullfunction.word getenv.word nullfunction.word nullfunction.word nullfunction.word nullfunction

3.3 初始化内存

让我们看看 locate 标号之后的代码是些什么

/**  We get here from executing a bal to get the PC value of the current execute*  location into ra. Check to see if we run from ROM or if this is ramloaded.*/
locate:la        s0, start                subu    s0, ra, s0                and        s0, 0xffff0000            li        t0, SR_BOOT_EXC_VECmtc0    t0, COP_0_STATUS_REGmtc0    zero, COP_0_CAUSE_REG    .set noreorder/* the varible bonito is register s4, BONITO_REG_BASE is 0x1fe00000 */li        bonito, PHYS_TO_UNCACHED(BONITO_REG_BASE)  bal    1f    nop            /* now the value of ra is 0xbfc00xxx *//* bonito endianess */BONITO_BIC(BONITO_BONPONCFG, BONITO_BONPONCFG_CPUBIGEND)BONITO_BIC(BONITO_BONGENCFG, BONITO_BONGENCFG_BYTESWAP|BONITO_BONGENCFG_MSTRBYTESWAP)BONITO_BIS(BONITO_BONPONCFG, BONITO_BONPONCFG_IS_ARBITER)/** In certain situations it is possible for the Bonito ASIC* to come up with the PCI registers uninitialised, so do them here*/BONITO_INIT(BONITO_PCICLASS,(PCI_CLASS_BRIDGE << PCI_CLASS_SHIFT) | (PCI_SUBCLASS_BRIDGE_HOST << PCI_SUBCLASS_SHIFT))BONITO_INIT(BONITO_PCICMD, BONITO_PCICMD_PERR_CLR | BONITO_PCICMD_SERR_CLR | BONITO_PCICMD_MABORT_CLR | BONITO_PCICMD_MTABORT_CLR | BONITO_PCICMD_TABORT_CLR | BONITO_PCICMD_MPERR_CLR )//BONITO_INIT(BONITO_PCILTIMER, 0)BONITO_INIT(BONITO_PCILTIMER, 255)BONITO_INIT(BONITO_PCIBASE0, 0)BONITO_INIT(BONITO_PCIBASE1, 0)BONITO_INIT(BONITO_PCIBASE2, 0)BONITO_INIT(BONITO_PCIEXPRBASE, 0)BONITO_INIT(BONITO_PCIINT, 0)BONITO_BIS(BONITO_PCICMD, BONITO_PCICMD_PERRRESPEN)BONITO_BIS(BONITO_PCICMD, PCI_COMMAND_IO_ENABLE|PCI_COMMAND_MEM_ENABLE|PCI_COMMAND_MASTER_ENABLE)BONITO_BIC(BONITO_BONGENCFG, 0x80)  #½ûÖ¹iobc#BONITO_BIS(BONITO_BONGENCFG, BONITO_BONGENCFG_BUSERREN)/* Set debug mode */BONITO_BIS(BONITO_BONGENCFG, BONITO_BONGENCFG_DEBUGMODE)/******** added to init southbridge*/
#ifdef VGA_NOTEBOOK_V2ISA_BRMW_INIT(0,0x74,0xeb,0x0)ISA_BRMW_INIT(0,0x75,0xff,0x20)ISABWWR_INIT(4,0x48,0xb000)ISABBWR_INIT(4,0x41,0x80)RMW_INIT(MOD_W,(PCI_IO_SPACE+0xb04c),0xffffffdf,0x0)
#endif// SouthBridge settings/* Set the SMB base address */ISABWWR_INIT(4, SMBUS_IO_BASE_ADDR, SMBUS_IO_BASE_VALUE | 0x1)/* enable the host controller */ISABHWR_INIT(4, SMBUS_HOST_CONFIG_ADDR, SMBUS_HOST_CONFIG_ENABLE_BIT)/* enable the SMB IO ports */ISABBWR_INIT(4, PCI_COMMAND_STATUS_REG, PCI_COMMAND_IO_ENABLE)ISARD_INIT(CTC_PORT+PT_CONTROL)/* program i8254 ISA refresh counter */ISAWR_INIT(CTC_PORT+PT_CONTROL,PTCW_SC(PT_REFRESH)|PTCW_16B|PTCW_MODE(MODE_RG))ISAWR_INIT(CTC_PORT+PT_REFRESH, ISAREFRESH & 0xff)ISAWR_INIT(CTC_PORT+PT_REFRESH, ISAREFRESH >> 8)EXIT_INIT(0)1:    move a0, ra            /* now the value of ra is 0xbfc00xxx */
reginit:            lw    t3, Init_Op(a0)lw    t0, Init_A0(a0)        /* Init_A0 is 4 */and    t4, t3, OP_MASK        /* OP_MASK is 0x000000fc, to keep 4 bytes aligned *//* * EXIT(STATUS) */bne    t4, OP_EXIT, 8f        /* OP_EXIT is 0x00000000 */nopmove v0, t0                /* now v0 is the content of 4 bytes offset from 0xbfc000xx */b    .donenop/* * DELAY(CYCLES) */
8:    bne    t4, OP_DELAY, 8f    /* OP_DELAY is 0x00000008 */nop
1:    bnez    t0,1b            /* t0 不等于 0就在这死循环 */subu    t0,1b    .nextnop    /*  * READ(ADDR) */
8:    bne    t4, OP_RD, 8f        /* OP_RD is 0x00000010 */nopand    t4, t3, MOD_MASK    /* MOD_MASK is 0x00000003 */bne    t4, MOD_B, 1f        /* MOD_B is 0x00000000 ??? why not 0x01 or 0x03 */noplbu    t5, 0(t0)b    .nextnop
1:    bne    t4, MOD_H, 1f        /* MOD_H is 0x00000001 ??? why not 0x02 */noplhu    t5, 0(t0)b    .nextnop
1:    bne    t4, MOD_W, 1f        /* MOD_H is 0x00000002 ??? why not 0x00 */nop
#if __mips64lwu    t5, 0(t0)
#else lw    t5, 0(t0)
#endifb    .nextnop
1:    
#if __mips64lw    t5,0(t0)b    .nextnop
#elseb    .fatalnop
#endif/* * WRITE(ADDR,VAL) */
8:    bne    t4, OP_WR, 8f        /* OP_WR is 0x00000014 */noplw    t1, Init_A1(a0)            /* Init_A1 is 8 */and    t4, t3, MOD_MASK    /* MOD_MASK is 0x00000003 */bne    t4, MOD_B, 1fnopsb    t1, 0(t0)b    .nextnop
1:    bne    t4,MOD_H,1fnopsh    t1,0(t0)b    .nextnop
1:    bne    t4,MOD_W,1fnopsw    t1,0(t0)b    .nextnop1:    
#if __mips64sd    t1,0(t0)b    .nextnop
#elseb    .fatalnop
#endif/* * RMW(ADDR,AND,OR) */
8:    bne    t4,OP_RMW,8fnoplw    t1,Init_A1(a0)lw    t2,Init_A2(a0)and    t4,t3,MOD_MASKbne    t4,MOD_B,1fnoplbu    t4,0(t0)and    t4,t1or    t4,t2sb    t4,0(t0)b    .nextnop
1:    bne    t4,MOD_H,1fnoplhu    t4,0(t0)and    t4,t1or    t4,t2sh    t4,0(t0)b    .nextnop
1:    bne    t4,MOD_W,1fnoplw    t4,0(t0)and    t4,t1or    t4,t2sw    t4,0(t0)b    .nextnop1:        
#if __mips64ld    t4,0(t0)and    t4,t1or    t4,t2sd    t4,0(t0)b    .nextnop
#else    b    .fatalnop
#endif/* * WAIT(ADDR,MASK,VAL) */
8:    bne    t4,OP_WAIT,8fnoplw    t1,Init_A1(a0)lw    t2,Init_A2(a0)and    t4,t3,MOD_MASKbne    t4,MOD_B,1fnop
3:    lbu    t4,0(t0)and    t4,t1bne    t4,t2,3bnopb    .nextnop
1:    bne    t4,MOD_H,1fnop
3:    lhu    t4,0(t0)and    t4,t1bne    t4,t2,3bnopb    .nextnop
1:    bne    t4,MOD_W,1fnop
3:    lw    t4,0(t0)and    t4,t1bne    t4,t2,3bnopb    .nextnop
1:        
#if __mips64
3:    ld    t4,0(t0)and    t4,t1bne    t4,t2,3bnopb    .nextnop
#else    b    .fatal    nop
#endif.next:    addu    a0, Init_Size        /* Init_Size is 16 */b    reginit                /* a big repeatation */nop    8:
.fatal:    b .donenopbal stuck                /* these two sentences seem been ignored */nop=====================        
解释:
locate:la        s0, start                subu    s0, ra, s0                and        s0, 0xffff0000        
此时,ra 中的地址值是前面 uncached 标号的地址,第二句作用是计算前面跳转时已运行过的代码的长度,最后一句把零头截掉。
这段代码是为了访问数据,因为这段汇编在Rom执行,而编译出来的数据段在 0x8002xxxx,
为了能够访问数据段的数据,需要进行一个地址的修正,s0 正是起到这种修正的目的。li        t0, SR_BOOT_EXC_VECmtc0    t0, COP_0_STATUS_REGmtc0    zero, COP_0_CAUSE_REG    
为保险起见,再清理一遍配置寄存器.set noreorder/* the varible bonito is register s4, BONITO_REG_BASE is 0x1fe00000 */li        bonito, PHYS_TO_UNCACHED(BONITO_REG_BASE)  bal    1f    nop            /* now the value of ra is 0xbfc00xxx */
将 BONITO_REG_BASE 的物理地址值保存到 s4 寄存器
(通过映射到未经缓存的地址空间里,龙芯 CPU 访问外部空间,只能用映射后的地址),
然后跳转到后面1标号处执行。1:    move a0, ra        /* now the value of ra is 0xbfc00xxx */
reginit:            /* local name */lw    t3, Init_Op(a0)lw    t0, Init_A0(a0)        // Init_A0 is 4and    t4, t3, OP_MASK        // OP_MASK is 0x000000fc, to keep 4 bytes aligned
在1标号的地方,取跳转时压入的RA寄存器的值,然后通过寄存器相对寻址的方式,取得跳转指令后面保存的参数,并保存到t3, t0寄存器。上句说的就是这些参数/* bonito endianess */BONITO_BIC(BONITO_BONPONCFG, BONITO_BONPONCFG_CPUBIGEND)BONITO_BIC(BONITO_BONGENCFG, BONITO_BONGENCFG_BYTESWAP|BONITO_BONGENCFG_MSTRBYTESWAP)BONITO_BIS(BONITO_BONPONCFG, BONITO_BONPONCFG_IS_ARBITER)/** In certain situations it is possible for the Bonito ASIC* to come up with the PCI registers uninitialised, so do them here*/BONITO_INIT(BONITO_PCICLASS,(PCI_CLASS_BRIDGE << PCI_CLASS_SHIFT) | (PCI_SUBCLASS_BRIDGE_HOST << PCI_SUBCLASS_SHIFT))BONITO_INIT(BONITO_PCICMD, BONITO_PCICMD_PERR_CLR | BONITO_PCICMD_SERR_CLR | BONITO_PCICMD_MABORT_CLR | BONITO_PCICMD_MTABORT_CLR | BONITO_PCICMD_TABORT_CLR | BONITO_PCICMD_MPERR_CLR )//BONITO_INIT(BONITO_PCILTIMER, 0)BONITO_INIT(BONITO_PCILTIMER, 255)BONITO_INIT(BONITO_PCIBASE0, 0)BONITO_INIT(BONITO_PCIBASE1, 0)BONITO_INIT(BONITO_PCIBASE2, 0)BONITO_INIT(BONITO_PCIEXPRBASE, 0)BONITO_INIT(BONITO_PCIINT, 0)BONITO_BIS(BONITO_PCICMD, BONITO_PCICMD_PERRRESPEN)BONITO_BIS(BONITO_PCICMD, PCI_COMMAND_IO_ENABLE|PCI_COMMAND_MEM_ENABLE|PCI_COMMAND_MASTER_ENABLE)BONITO_BIC(BONITO_BONGENCFG, 0x80)  #½ûÖ¹iobc#BONITO_BIS(BONITO_BONGENCFG, BONITO_BONGENCFG_BUSERREN)/* Set debug mode */BONITO_BIS(BONITO_BONGENCFG, BONITO_BONGENCFG_DEBUGMODE)/******** added to init southbridge*/
#ifdef VGA_NOTEBOOK_V2ISA_BRMW_INIT(0,0x74,0xeb,0x0)ISA_BRMW_INIT(0,0x75,0xff,0x20)ISABWWR_INIT(4,0x48,0xb000)ISABBWR_INIT(4,0x41,0x80)RMW_INIT(MOD_W,(PCI_IO_SPACE+0xb04c),0xffffffdf,0x0)
#endif// SouthBridge settings/* Set the SMB base address */ISABWWR_INIT(4, SMBUS_IO_BASE_ADDR, SMBUS_IO_BASE_VALUE | 0x1)/* enable the host controller */ISABHWR_INIT(4, SMBUS_HOST_CONFIG_ADDR, SMBUS_HOST_CONFIG_ENABLE_BIT)/* enable the SMB IO ports */ISABBWR_INIT(4, PCI_COMMAND_STATUS_REG, PCI_COMMAND_IO_ENABLE)ISARD_INIT(CTC_PORT+PT_CONTROL)/* program i8254 ISA refresh counter */ISAWR_INIT(CTC_PORT+PT_CONTROL,PTCW_SC(PT_REFRESH)|PTCW_16B|PTCW_MODE(MODE_RG))ISAWR_INIT(CTC_PORT+PT_REFRESH, ISAREFRESH & 0xff)ISAWR_INIT(CTC_PORT+PT_REFRESH, ISAREFRESH >> 8)EXIT_INIT(0)
这些宏实际上不是语句,看定义后就知道它们只是定义了一些数据参数,在ROM中占据了一定的长度。/* * EXIT(STATUS) */bne    t4, OP_EXIT, 8f        // OP_EXIT is 0x00000000nopmove v0, t0                // now v0 is the content of 4 bytes offset from 0xbfc000xxb    .donenop
接着就运行 
bne t4, OP_EXIT, 8f
这句了,在这里做是否初始化寄存器完成的判断,如果没有完成,就会跳到后面8标号处运行,然后经历一系列的设置(后面接着的那片代码)
DELAY(CYCLES) 
READ(ADDR) 
WRITE(ADDR,VAL) RMW(ADDR,AND,OR) 
WAIT(ADDR,MASK,VAL) 
后,直到 OP_EXIT 标志出现,才退出这个设置循环。看到前面有一行 EXIT_INIT(0),表示那个参数数据段结束了,它的宏定义如下:
#define EXIT_INIT(status) .word OP_EXIT, (status); .word 0,0
所以在最后一项的数据记录被读取后,总是能退出这个初始化循环的,接着就会跳到.done这个标号里运行。不过,这段代码到底是要设置什么?由DELAY,READ,WRITE,RMW,WAIT 这些符号所标示的代码段实现其相应的功能没有?我还不清楚。

3.4 内存地址修正

la    s0, start            
subu    s0, ra, s0
and    s0, 0xffff0000 这段代码是为了访问数据,因为这段汇编在Rom执行,而编译出来的数据段在0x8002xxxx,为了能够访问数据段的数据,需要进行一个地址的修正,s0这是起到这种修正的目的。
la      v0, initmips
jalr    v0
nop从此代码便到内存中间去了,从这开始因为可以读写内存,所以有了栈,故可以用C的代码了,所以以后的程序便是C代码了.

3.5 初始化北桥和串口

接着看下面一段代码

.done:    bal superio_init        /* initialize the southbridge config register */nopbal    initserial            /* initialize the output of serial port, after this step */nop                        /* pmon can output some infomations from COM port*/PRINTSTR("\r\nPMON2000 MIPS Initializing. Standby...\r\n")/* begin to check some config registers on CP0 */PRINTSTR("ERRORPC=")mfc0    a0, COP_0_ERROR_PCbal    hexserialnopPRINTSTR(" CONFIG=")mfc0    a0, COP_0_CONFIGbal    hexserialnopPRINTSTR("\r\n")PRINTSTR(" PRID=")mfc0    a0, COP_0_PRIDbal    hexserialnopPRINTSTR("\r\n")=====================
解释:
在这段程序里,主要做了两件大事情,一是初始化南桥芯片VIA686B,一是初始化串口输出。
初始化VIA686B是调用子函数superio_init 实现的。初始化串口是调用子函数initserial实现的。
为了尽快地从串口输出调试信息,所以要先初始化VIA686B芯片,才能输出信息出来。
由于 VIA686B芯片包括所有外面接口的功能,比如串口, PS2,USB,并口,还有软盘等等。
只要能从串口输出字符,就已经是成功的第一步了。
在嵌入式的软件开发中,调试软件是最难的,只能根据芯片的管脚电平,或者串口发些调信息出来。
使用管脚调试,最简单的办法,就是加一个指示灯,这也叫“点灯大法”。
只要串口能输出字符串后,使用串口调试就成为基本的方法了。
后面,输出三个CP0寄存器的值,第一个寄存器是出错信息,第二个寄存器是CP0配置信息,第三个寄存器是CP0处理器的ID信息。
=====================

3.6 初始化E2PROM,并且读取E2PROM参数

下面一段代码从内存条上的SPD(eeprom)中读取内存参数,并且初始化内存窗口。这段代码放到另一篇文章中专门讲解吧。这里就不多说了。

/* * Now determine DRAM configuration and size by* reading the I2C EEROM (SPD) on the DIMMS (DDR)*/PRINTSTR("DIMM read\r\n")/* only one memory slot, slave address is 10100001b */li  a1, 0x0
1:li    a0, 0xa1    /* a0: slave address, a1: reg index to read */bal    i2creadnop/* save a1 */move t1, a1/* print */move a0, v0bal  hexserialnopPRINTSTR("\r\n")    /* restore a1 */move  a1,t1addiu a1,a1,1li   v0, 0x20bleu  a1, v0, 1b        /* repeat for 32 times */nopli    msize, 0            /* msize is register s2 *//* set some parameters for DDR333rank number and DDR type field will be filled laterto check: fix TCAS?*/li    sdCfg, 0x341043df        /* sdCfg is register s6 *//* read DIMM memory type (must be DDRAM) */
#if 0li    a0,0xa1li    a1,2bal    i2creadnopbne    v0,7,.nodimmnopPRINTSTR("read memory type\r\n") 
#endif/* read DIMM number of rows */li    a0, 0xa1li    a1, 3bal    i2creadnop    move    a0, v0        // v0 is the return value registersubu    v0, 12move    s1, v0        // save for later usebgtu    v0, 2, .nodimm        // if v0 > 2 then jump to .nodimmnopPRINTSTR("read number of rows\r\n")2:    /* read DIMM number of cols */li    a0, 0xa1li    a1, 4bal    i2creadnopsubu    v0, 8                // v0 saved the return valuebgtu    v0, 4, .nodimmnop// read and check ddr type, the combination of t1 and v0 represents a ddr typemove    t1, s1bne    t1, 0, 10fnopbne    v0, 2, 20fnopli    v0, 0b    .ddrtypenop
20:    bne    v0, 1, 21fnopli    v0, 1b    .ddrtypenop
21:    bne    v0, 0, 22fnopli    v0, 2b    .ddrtypenop
22:    bne    v0, 3, 33fnopli    v0, 3b    .ddrtypenop
10:    bne    t1, 1, 11fnopbne    v0, 3, 20fnopli    v0, 4b    .ddrtypenop
20:    bne    v0, 2, 21fnopli    v0, 5b    .ddrtypenop
21:    bne    v0, 1, 22fnopli    v0, 6b    .ddrtypenop
22:    bne    v0, 4, 33fnopli    v0, 7b    .ddrtypenop
11:    bne    t1, 2, 33fnopbne    v0, 4, 20fnopli    v0, 8b    .ddrtypenop
20:    bne    v0, 3, 21fnopli    v0, 9b    .ddrtypenop
21:    bne    v0, 2, 33fnopli    v0, 10b    .ddrtypenop
33:    PRINTSTR("DDR type not supported!\r\n");
34:    b    34bnop.ddrtype:#bit 25:22 is DDR type fieldsll    v0, 22 and    v0, 0x03c00000or    sdCfg, v0/* read DIMM memory size per side */li    a0, 0xa1li    a1, 31bal    i2creadnopbeqz    v0,.nodimmnopsll    tmpsize,v0,22        # multiply by 4MPRINTSTR("read memory size per side\r\n") 2:    /* read DIMM number of blocks-per-ddrram */li    a1,17bal    i2creadnopbeq    v0,2,2fnopbne    v0,4,.nodimmnopPRINTSTR("read blocks per ddrram\r\n")2:    /* read DIMM number of sides (banks) */li    a1,5bal    i2creadnopbeq    v0,1,2fnopbne    v0,2,.nodimmnopsll    tmpsize,1    # msize *= 2    or  sdCfg, 0x1<<27PRINTSTR("read number of sides\r\n") 2:    /* read DIMM width */li    a1,6bal    i2creadnopbleu    v0,36,2fnopbgtu    v0,72,.nodimmnopPRINTSTR("read width\r\n") 2:    addu    msize,tmpsizeb    2fnop    .nodimm:move    dbg,a0        // dbg is s5PRINTSTR ("\r\nNo DIMM in slot ")move    a0,dbgbal    hexserialnopPRINTSTR("\r\n")move    a0,dbg#li  msize,0x10000000#li    sdCfg,0x3d9043df    #~133MHzli  msize,0x20000000li    sdCfg,0x3d5043df     #~133MHz2:PRINTSTR("DIMM SIZE=")move    a0,msizebal    hexserialnopPRINTSTR("\r\n")li    t0, 0xbff00008sd    sdCfg, 0(t0)nopnop/* (uint32_t *)0xbfe00040 = 0x80000000* means only address below 1G will be sent to CPU*/lui    t0, 0xbfe0li    t1, 0x80000000sw    t1, 0x40(t0)nop#### gx 2006-03-17: mode #####li    t1,0x20li    t1,0x28li    t0, 0xbff00000sd    t1,0(t0)nopli    t1,0x0li    t0, 0xbff00000sd    t1,0x30(t0)nop##fixed base address reg##sd    zero, 0x10(t0)noplui    t1,0x2000sd    t1,0x20(t0)nopli      t1, 0x10000000blt     msize, t1, 1fnop####bigger than 256MB####sd    t1, 0x18(t0)nopmove    a0, msizesubu    a0, t1nopnopnopsd    a0, 0x28(t0)nopb    2f1:nopnopsd    msize, 0x18(t0)nopnopnopsd    zero, 0x28(t0)nopnopnop2:PRINTSTR("sdcfg=");move    a0,sdCfgbal    hexserialnopPRINTSTR("\r\n");PRINTSTR("msize=");move    a0,msizebal    hexserialnopPRINTSTR("\r\n")skipdimm:li    t1,0        # accumulate pcimembasecfg settings/* set bar0 mask and translation to point to SDRAM */sub    t0,msize,1not    t0srl    t0,BONITO_PCIMEMBASECFG_ASHIFT-BONITO_PCIMEMBASECFG_MEMBASE0_MASK_SHIFTand    t0,BONITO_PCIMEMBASECFG_MEMBASE0_MASKor    t1,t0li    t0,0x00000000srl    t0,BONITO_PCIMEMBASECFG_ASHIFT-BONITO_PCIMEMBASECFG_MEMBASE0_TRANS_SHIFTand    t0,BONITO_PCIMEMBASECFG_MEMBASE0_TRANSor    t1,t0or    t1,BONITO_PCIMEMBASECFG_MEMBASE0_CACHED/* set bar1 to minimum size to conserve PCI space */li    t0, ~0srl    t0,BONITO_PCIMEMBASECFG_ASHIFT-BONITO_PCIMEMBASECFG_MEMBASE1_MASK_SHIFTand    t0,BONITO_PCIMEMBASECFG_MEMBASE1_MASKor    t1,t0li    t0,0x00000000srl    t0,BONITO_PCIMEMBASECFG_ASHIFT-BONITO_PCIMEMBASECFG_MEMBASE1_TRANS_SHIFTand    t0,BONITO_PCIMEMBASECFG_MEMBASE1_TRANSor    t1,t0or    t1,BONITO_PCIMEMBASECFG_MEMBASE1_CACHEDsw    t1,BONITO_PCIMEMBASECFG(bonito)/* enable configuration cycles now */lw    t0,BONITO_BONPONCFG(bonito)and    t0,~BONITO_BONPONCFG_CONFIG_DISsw    t0,BONITO_BONPONCFG(bonito)PRINTSTR("Init SDRAM Done!\r\n");

3.7 初始化Cache

下面这段是缓存配置的代码

/**  Reset and initialize caches to a known state.*/
#define IndexStoreTagI    0x08
#define IndexStoreTagD    0x09
#define IndexStoreTagS    0x0b
#define IndexStoreTagT    0x0a
#define FillI        0x14/**  caches config register bits.*/
#define CF_7_SE         (1 << 3)        /* Secondary cache enable */
#define CF_7_SC         (1 << 31)       /* Secondary cache not present */
#define CF_7_TE         (1 << 12)       /* Tertiary cache enable */
#define CF_7_TC         (1 << 17)       /* Tertiary cache not present */
#define CF_7_TS         (3 << 20)       /* Tertiary cache size */
#define CF_7_TS_AL      20              /* Shift to align */
#define NOP8 nop;nop;nop;nop;nop;nop;nop;nop
do_caches:TTYDBG("Sizing caches...\r\n");mfc0    t3, COP_0_CONFIG    /* t3 = original config */and    t3, 0xffffeff0        /* Make sure coherency is OK */and    t3, ~(CF_7_TE|CF_7_SE|CF_7_TC|CF_7_SC)  /* disable L2/L3 cache */mtc0    t3, COP_0_CONFIGli    t2, 4096srl    t1, t3, 9and    t1, 3sllv    s3, t2, t1        /* s3 = I cache size */#ifdef CONFIG_CACHE_64K_4WAY sll     s3,2
#endifand    t1, t3, 0x20srl    t1, t1, 1addu    s4, t1, 16        /* s4 = I cache line size */srl    t1, t3, 6and    t1, 3sllv    s5, t2, t1        /* s5 = D cache size */#ifdef CONFIG_CACHE_64K_4WAYsll     s5,2
#endifand    t1, t3, 0x10addu    s6, t1, 16        /* s6 = D cache line size */TTYDBG("Init caches...\r\n")li    s7, 0                   /* no L2 cache */li    s8, 0                   /* no L3 cache */#if 0mfc0    a0, COP_0_PRIDli      a1, 0x6301bne     a0,a1,1fnop
#endifTTYDBG("godson2 caches found\r\n")bal     godson2_cache_initnop
#####xuhua########open cp1 
#if 1mfc0   t0,COP_0_STATUS_REGand    t0,0xdbffffffor     t0,t0,0x24000000 mtc0   t0,COP_0_STATUS_REG
#endif
#################/* close L2 cache */li      a0, 0xbfe00164sw      zero, 0(a0);mfc0   a0,COP_0_CONFIGand    a0,a0,~((1<<12) | 3)or     a0,a0,2mtc0   a0,COP_0_CONFIG#ifdef DEBUG_LOCORETTYDBG("Init caches done, cfg = ")mfc0    a0, COP_0_CONFIGbal    hexserialnopTTYDBG("\r\n\r\n")
#endif

3.8 PMON自身从ROM中拷贝到RAM(在Cache之后)

下面这段代码是把PMON自身从ROM中拷贝到RAM中去

// copy self code segmentTTYDBG("Copy PMON to execute location...\r\n")
#ifdef DEBUG_LOCORETTYDBG("  start = 0x")la    a0, startbal    hexserialnopTTYDBG("\r\n  s0 = 0x")move    a0, s0bal    hexserialnopTTYDBG("\r\n")
#endifla    a0, startli    a1, 0xbfc00000la    a2, _edataor      a0, 0xa0000000or      a2, 0xa0000000subu    t1, a2, a0srl    t1, t1, 2move    t0, a0move    t1, a1move    t2, a2/* copy text section */1:    and    t3,t0,0x0000ffffbnez    t3,2fnopmove    a0,t0bal    hexserialnopli    a0,'\r'bal     tgt_putcharnop
2:    lw    t3, 0(t1)nopsw    t3, 0(t0)addu    t0, 4addu    t1, 4bne    t2, t0, 1bnopPRINTSTR("\ncopy text section done.\r\n")/* Clear BSS */la    a0, _edatala    a2, _end
2:    sw    zero, 0(a0)bne    a2, a0, 2baddu    a0, 4TTYDBG("Copy PMON to execute location done.\r\n")

3.9 汇编到C语言

下面这段代码从汇编世界跳到C世界中去了。

TTYDBG("sp=");move a0, spbal    hexserialnop#if 1mfc0   a0,COP_0_CONFIGand    a0,a0,0xfffffff8or     a0,a0,0x3mtc0   a0,COP_0_CONFIG
#endifli    a0, 4096*1024sw    a0, CpuTertiaryCacheSize /* Set L3 cache size */move    a0,msizesrl    a0,20/* pass pointer to kseg1 tgt_putchar */la  a1, tgt_putcharaddu a1,a1,s0            // la    s0,start// subu    s0,ra,s0            ??? ra is the returning address// and    s0,0xffff0000        ??? now what does s0 mean?la  a2, stringserialaddu a2,a2,s0la    v0, initmips        // further ENTRY of PMONjalr    v0nop

它山之石:

龙芯相关 - 心映真的空间 (wikidot.com)

这篇关于[嵌入式系统-40]:龙芯1B 开发学习套件 -10-PMON启动过程start.S详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/822589

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

作业提交过程之HDFSMapReduce

作业提交全过程详解 (1)作业提交 第1步:Client调用job.waitForCompletion方法,向整个集群提交MapReduce作业。 第2步:Client向RM申请一个作业id。 第3步:RM给Client返回该job资源的提交路径和作业id。 第4步:Client提交jar包、切片信息和配置文件到指定的资源提交路径。 第5步:Client提交完资源后,向RM申请运行MrAp