关于ARM CM3的启动文件分析

2019-12-26 来源：eefocus

下面以ARM Cortex_M3裸核的启动代码为例，做一下简单的分析。首先，在启动文件中完成了三项工作：

1、堆栈以及堆的初始化

2、定位中断向量表

3、调用Reset Handler。

在介绍之前，我们先了解一下ARM芯片启动文件中涉及到的一些汇编指令的用法。

补充一下，其中DCD相当于C语言当中的&，定义地址。

1、堆栈以及堆的初始化

1.1 堆栈的初始化

Startup_xxx.s中的堆栈初始化代码

　　Stack_Size EQU 0x00000400，这个语句相当于Stack_Size这个标号（标号：链接器的术语，下文中提到的所有“标号”，指的都是指的链接器中的标号）等于0x00000400相当于C语言中的#define Stack_Size 0x00000400 ，也就是说此语句只是一个声明，并未分配地址。

　　AREA STACK, NOINIT, READWRITE, ALIGN=3，此语句定义了一个叫STACK的代码段，并指明8字节对齐（ALIGN = 3）。其中NOINIT表示未初始化，READWRITE表示可读可写，ALIGN = 3，即表示2^3 = 8，八字节对齐。

　　Stack_Mem SPACE Stack_Size，为Stack_Mem分配Stack_Size大小的一块内存区域，注意这里分配的是RAM，即分配了大小为1KB的内存空间（0x00000400 = 1024）。

　　__initial_sp ，紧跟着栈分配内存后，所以其为栈顶（满递减栈）。此标号有一层隐含的意思就是在M3中堆栈是满递减堆栈，因为它指定了堆栈指针位于堆栈的高地址（在Stack_Mem之后），具体如下图所示。

堆栈指针sp位置

　　上图来自Cortex_M3的一个工程的xxx.map文件。可以看出栈的起始地址为0x20000c68，大小为1024字节（即0x00000400 = Stack_Size）。而堆栈指针的位置在0x20001068，其等于栈的起始地址0x2000c68+0x00000400，说明本系列的Cortex_M3微控制器的堆栈为满递减堆栈。

　　所以__initial_sp为1KB空间栈的栈顶，栈主要用于局部变量和形参的调用过程的临时存储，属于编译器自动分配和释放的内存，所以这里需要注意如果你的函数所占的内存过大，那么这个空间应调整其大小但一定要小于内部SRAM的大小。堆是程序员空间是程序员进行分配和释放的，如果程序中未释放最后由系统回收。

1.2 堆的初始化

Startup_xxx.s中的堆初始化代码

堆的初始化过程与堆栈的初始化相同。

2、中断向量表的初始化

中断向量表的初始化代码（部分）

PRESERVE8指定了以下的代码为8字节对齐，这是keil编译器的一个编程要求，对齐情况如下图所示：

xxx.list文件中的8字节对齐示意图

　　THUMB指定了接下来的代码为THUMB指令集。

　　AREA RESET, DATA, READONLY，此语句声明RESET数据段。

　　EXPORT __Vectors，导出向量表标号，EXPORT作用类似于C语言中的extern。之后的代码就是为向量表分配存储区域。中断向量表从FLASH的0x00000000地址开始放置，以4个字节为一个单位，地址0存放的是栈顶指针（sp）的地址，0x00000004存放的是复位程序的地址，往后以此类推，这里我们只设置了一个Reset_Handler向量。从代码上看，向量表中存放的都是中断服务函数的函数名，可我们知道C语言中的函数名就是一个地址。（由此我们知道，中断函数的函数名都已经知道了，我们在写对应的中断服务程序时，从对应的地址取服务例程的入口地址并跳入执行）。但是此处有一个要注意的，就是0号地址不是什么入口地址，而是给出的复位后的MSP的初值。

3、调用Reset Handler

调用Reset Handler的代码

　　此段代码只完成了一个功能，引导程序进入__main。__main的具体行为在后面做具体描述。

　　PROC与ENDP组合在汇编中定义了一段子函数。

用户堆栈的初始化

具体的堆栈以及堆的初始化行为

　　这一部分也就是把初始化的堆栈地址赋值给单片机的对应寄存器以方便C程序进行分配释放使用。

4、其他代码

有一些芯片厂商对芯片的加密的加密级别的代码也会放在这里，芯片上电后会自动读取这一地址的值以确定芯片的加密方式。

5、ARM芯片的启动过程详解

　　接下来介绍__main函数的具体实现过程。

　　首先在介绍__main函数之前，我们先了解一些关于ARM芯片在启动过程中的基本知识。

“ARM程序”是指在ARM系统中正在执行的程序，而非保存在ROM中的.bin(.axf,.hex)映像（image）文件。

一个ARM程序包含3部分：RO，RW和ZI

RO 就是只读数据，是程序中指令和常量；

RW是可读写的数据，程序中已初始化变量；

ZI 是程序中未初始化的变量和初始化为0的变量。

简单理解就是：

RO就是readonly，RW就是read/write，ZI就是zero initial。

ARM芯片的启动过程详解

注意，以上的过程并非绝对的，不同的ARM架构或者是不同的代码以上的执行过程是不同的。

复位处理程序是在汇编器中编写的短模块，系统一启动就立即执行。复位处理程序最少要为应用程序的运行模式初始化堆栈指针。对于具有本地内存系统（如缓存、TCM、MMU和MPU）的处理器，某些配置必须在初始化过程的这一阶段完成。复位处理程序在执行之后，通常跳到__main以开始C库初始化序列。

__main中的__scatterload负责设置内存，而__rt_entry负责设置运行时的环境。__scatterload中负责把RO/RW（非零）输出段从装载域地址复制到运行域地址（执行代码和数据复制、解压缩），并完成ZI段运行域数据的0初始化工作。然后跳到__rt_entry设置堆栈和堆、初始化库函数和静态数据。然后，__rt_entry跳转到应用程序的入口main()。主应用程序结束执行后，__rt_entry将库关闭，然后把控制权交换给调试器。函数标签main()具有特殊含义。Main()函数的存在强制链接器链接到__main和__rt_entry中的代码。如果没有标记为main()的函数，则没有链接到初始化序列，因而部分标准C库功能得不到支持。

6、结合代码来看芯片启动过程

上电后硬件设置sp、pc，刚上电复位后，硬件会自动根据向量表地址找到向量表。

在离开复位状态后， CM3 做的第一件事就是读取下列两个 32 位整数的值：

1、从地址 0x0000 0000 处取出 MSP 的初始值。

2、从地址 0x0000 0004 处取出 PC 的初始值，这个值是复位向量， LSB 必须是 1。然后从这个值所对应的地址处取指。

硬件自动从0x0000 0000位置处读取数据赋给栈指针sp，然后从0x0000 0004位置处读取数据赋给pc指针，完成复位，结果为：

SP = 0x2000 1068

PC = 0x0000 011D

这与传统的 ARM 架构不同——其实也和绝大多数的其它单片机不同。传统的 ARM 架构总是从 0 地址开始执行第一条指令。它们的 0 地址处总是一条跳转指令。在 CM3 中，在 0 地址处提供 MSP 的初始值，然后紧跟着就是向量表。向量表中的数值是 32 位的地址，而不是跳转指令。向量表的第一个条目指向复位后应执行的第一条指令，就是我们上面分析的Reset_Handler这个函数。

进入__main

　　LDR R0, =__main

　　BX　　 R0