历史上的今天
返回首页

历史上的今天

今天是:2025年08月04日(星期一)

正在发生

2021年08月04日 | 7. 从0学ARM-GNU伪指令、代码编译,lds使用

2021-08-04 来源:eefocus

一、MDK和GNU伪指令区别

我们在学习汇编代码的时候经过会看到以下两种风格的代码:


gnu代码开头是:


.global _start

_start:      @汇编入口

ldr sp,=0x41000000.end         @汇编程序结束


MDK代码开头是:


AREA Example,CODE,READONLY    ;声明代码段Example

ENTRY ;程序入口

Start             

MOV R0,#0     OVER

END


这两种风格的代码是要使用不同的编译器,我们之前的实例代码都是MDK风格的。


那么多对于我们初学者来说要学习哪种风的呢?

答案是肯定的,学习GNU风格的汇编代码,因为做Linux驱动开发必须掌握的linux内核、uboot,而这两个软件就是GNU风格的。


为了大家不要把过多精力浪费在暂时没用的知识上,下面我们只讲GNU风格汇编。


二、GNU汇编书写格式:

1. 代码行中的注释符号:

‘@’ 整行注释符号:

‘#’ 语句分离符号:

直接操作数前缀: ‘#’ 或 ‘$’


2. 全局标号:

标号只能由a~z,A~Z,0~9,“.”,_等(由点、字母、数字、下划线等组成,除局部标号外,不能以数字开头)字符组成,标号的后面加“:”。


段内标号的地址值在汇编时确定;

段外标号的地址值在连接时确定。


3. 局部标号:

局部标号主要在局部范围内使用而且局部标号可以重复出现。它由两部组成开头是一个0-99直接的数字局部标号 后面加“:”


F:指示编译器只向前搜索,代码行数增加的方向 / 代码的下一句

B:指示编译器只向后搜索,代码行数减小的方向


注意局部标号的跳转,就近原则

举例:


文件位置

arch/arm/kernel/entry-armv.S

三、伪操作:

1. 符号定义伪指令

标号含义
.global使得符号对连接器可见,变为对整个工程可用的全局变量
_start汇编程序的缺省入口是_ start标号,用户也可以在连接脚本文件中用ENTRY标志指明其它入口点.
.local表示符号对外部不可见,只对本文件可见

2. 数据定义(Data Definition)伪操作

数据定义伪操作一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。
常见的数据定义伪操作有如下几种:

标号含义
.byte单字节定义 0x12,‘a’,23 【必须偶数个】
.short定义2字节数据 0x1234,65535
.long /.word定义4字节数据 0x12345678
.quad定义8字节 .quad 0x1234567812345678
.float定义浮点数 .float 0f3.2
.string/.asciz/.ascii定义字符串 .ascii “abcd”, 注意:.ascii 伪操作定义的字符串需要每行添加结尾字符 ‘’,其他不需要
.space/.skip用于分配一块连续的存储区域并初始化为指定的值,如果后面的填充值省略不写则在后面填充为0;
.rept重复执行接下来的指令,以.rept开始,以.endr结束

【举例】

.word

val:   .word  0x11223344mov r1,#val  ;将值0x11223344设置到寄存器r1中


.space


   label: .space size,expr     ;expr可以是4字节以内的浮点数 

   a:  space 8, 0x1


.rept


 .rept cnt   ;cnt是重复次数 .endr


注意:


变量的定义放在,stop后,.end前

标号是地址的助记符,标号不占存储空间。位置在end前就可以,相对随意。

3. if选择

语法结构


.if  logical-expressing 

  ……                                   

.else

  …….endif


类似c语言里的条件编译 。


【举例】


.if  val2==1

mov r1,#val2.endif


4. macro宏定义

.macro,.endm 宏定义类似c语言里的宏函数 。


macro伪操作可以将一段代码定义为一个整体,称为宏指令。然后就可以在程序中通过宏指令多次调用该段代码。


语法格式:


   .macro    {$label} 名字{$parameter{,$parameter}…}……..code   .endm


其中,$标号在宏指令被展开时,标号会被替换为用户定义的符号。


宏操作可以使用一个或多个参数,当宏操作被展开时,这些参数被相应的值替换。


注意:先定义后使用


举例:


【例1】:没有参数的宏实现子函数返回


 .macro MOV_PC_LR

    MOV PC,LR .endm


调用方式如下:

    MOV_PC_LR


【例2】:带参数宏实现子函数返回


 .macro MOV_PC_LR ,param

    mov r1,param

    MOV PC,LR .endm


调用方法如下:


MOV_PC_LR  #12

四、杂项伪操作

标号含义
.global/用来声明一个全局的符号
.arm定义一下代码使用ARM指令集编译
.thumb定义一下代码使用Thumb指令集编译
.section.section expr 定义一个段。expr可以使.text .data. .bss
.text.text {subsection} 将定义符开始的代码编译到代码段
.data.data {subsection} 将定义符开始的代码编译到数据段,初始化数据段
.bss.bss {subsection} 将变量存放到.bss段,未初始化数据段
.align.align{alignment}{,fill}{,max} 通过用零或指定的数据进行填充来使当前位置与指定边界对齐

.align 4 — 16字节对齐 2的4次方

.align (4) — 4字节对齐
.org.org offset{,expr} 指定从当前地址加上offset开始存放代码,并且从当前地址到当前地址加上offset之间的内存单元,用零或指定的数据进行填充
.extern用于声明一个外部符号,用于兼容性其他汇编
.code 32同.arm
.code 16同.thumb
.weak用于声明一个弱符号,如果这个符号没有定义,编译就忽略,而不会报错
.end文件结束
.include.include “filename” 包含指定的头文件, 可以把一个汇编常量定义放在头文件中
.equ格式:.equ symbol, expression把某一个符号(symbol)定义成某一个值(expression).该指令并不分配空间,类似于c语言的 #define
.set给一个全局变量或局部变量赋值,和.equ的功能一样

举例:

.set


.set start, 0x40mov r1, #start      ;r1里面是0x40


举例

.equ


.equ   start,  0x40                                      mov r1, #start      ;r1里面是0x40


#define  PI  3.1415


等价于


.equ   PI, 31415


五、GNU伪指令

关键点:伪指令在编译时会转化为对应的ARM指令


ADR伪指令 :

该指令把标签所在的地址加载到寄存器中。

ADR伪指令为小范围地址读取伪指令,使用的相对偏移范围:当地址值是字节对齐 (8位) 时,取值范围为-255~255,当地址值是字对齐 (32位) 时,取值范围为-1020~1020。

语法格式:

  ADR{cond}   register,label

ADR      R0,  lable


ADRL伪指令:

将中等范围地址读取到寄存器中

ADRL伪指令为中等范围地址读取伪指令。使用相对偏移范围:当地址值是字节对齐时,取值范围为-64~64KB;当地址值是字对齐时,取值范围为-256~256KB


语法格式:


ADRL{cond}   register,label

ADRL        R0,lable


LDR伪指令:

LDR伪指令装载一个32位的常数和一个地址到寄存器。

语法格式:

LDR{cond}  register,=[expr|label-expr]LDR    R0,=0XFFFF0000      ; mov r1,#0x12   对比一下


注意:

(1)ldr伪指令和ldr指令区分

下面是ldr伪指令:


ldr r1,=val  @ r1 = val   是伪指令,将val标号地址赋给r1    

【与MDK不一样,MDK只支持ldr r1,=val】


下面是ldr指令:


ldr r2,val   @ r1 = *val    是arm指令,将标号val地址里的内容给r2

val: .word 0x11223344


(2)如何利用ldr伪指令实现长跳转


  ldr  pc,=32位地址


(3)编码中解决非立即数的问题

用arm伪指令ldr


ldr r0,=0x999   ;0x999  不是立即数,


六、GNU汇编的编译

1. 不含lds文件的编译

假设我们有以下代码,包括1个main.c文件,1个start.s文件:

start.s


.global _start

_start:      @汇编入口

ldr sp,=0x41000000

b main.global mystrcopy.text

mystrcopy: //参数dest->r0,src->r2

  LDRB r2, [r1], #1

  STRB r2, [r0], #1

  CMP r2, #0 //判断是不是字符串尾

  BNE mystrcopy

  MOV pc, lr

stop:

b stop   @死循环,防止跑飞 等价于while(1).end         @汇编程序结束


main.c


extern void mystrcopy(char *d,const char *s);int main(void){const char *src ="yikoulinux";char dest[20]={};mystrcopy(dest,src);//调用汇编实现的mystrcopy函数while(1);return 0;}

1.

Makefile编写方法如下:


1. TARGET=start   

2. TARGETC=main3. all:4. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGETC).o  $(TARGETC).c5. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGET).o $(TARGET).s6.    #arm-none-linux-gnueabi-gcc -O0 -g -S -o $(TARGETC).s  $(TARGETC).c

7. arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Ttext 0x40008000 -o $(TARGET).elf8. arm-none-linux-gnueabi-objcopy   -O binary -S  $(TARGET).elf  $(TARGET).bin9. clean:10. rm -rf *.o *.elf *.dis *.bin


Makefile含义如下:


定义环境变量TARGET=start,start为汇编文件的文件名

定义环境变量TARGETC=main,main为c语言文件

目标:all,4~8行是该指令的指令语句

将main.c编译生成main.o,$(TARGETC)会被替换成main

将start.s编译生成start.o,$(TARGET)会被替换成start

4-5也可以用该行1条指令实现

通过ld命令将main.o、start.o链接生成start.elf,-Ttext 0x40008000表示设置代码段起始地址为0x40008000

通过objcopy将start.elf转换成start.bin文件,-O binary (或–out-target=binary) 输出为原始的二进制文件,-S (或 --strip-all)输出文件中不要重定位信息和符号信息,缩小了文件尺寸,

clean目标

clean目标的执行语句,删除编译产生的临时文件

【补充】


gcc的代码优化级别,在 makefile 文件中的编译命令

4级 O0 – O3 数字越大,优化程度越高。O3最大优化

volatile作用

volatile修饰的变量,编译器不再进行优化,每次都真正访问内存地址空间。

2. 依赖lds文件编译

实际的工程文件,段复杂程度远比我们这个要复杂的多,尤其Linux内核有几万个文件,段的分布及其复杂,所以这就需要我们借助lds文件来定义内存的分布。

文件列表

main.c和start.s和上一节一致。


map.lds


OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/OUTPUT_ARCH(arm)ENTRY(_start)SECTIONS{. = 0x40008000;. = ALIGN(4);.text      :{.start.o(.text)*(.text)}. = ALIGN(4);.rodata : 

{ *(.rodata) }. = ALIGN(4);.data : 

{ *(.data) }. = ALIGN(4);.bss : { *(.bss) }}


解释一下上述的例子:


OUTPUT_FORMAT(“elf32-littlearm”, “elf32-littlearm”, “elf32-littlearm”)

指定输出object档案预设的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式;

OUTPUT_ARCH(arm) 指定输出的平台为arm,可以透过objdump -i查询支持平台;

ENTRY(_start) :将符号_start的值设置成入口地址;

. = 0x40008000: 把定位器符号置为0x40008000(若不指定, 则该符号的初始值为0);

.text : { .start.o(.text) *(.text) } :前者表示将start.o放到text段的第一个位置,后者表示将所有(*符号代表任意输入文件)输入文件的.text section合并成一个.text section;

.rodata : { *(.data) } : 将所有输入文件的.rodata section合并成一个.rodata section;

.data : { *(.data) } : 将所有输入文件的.data section合并成一个.data section;

.bss : { *(.bss) } : 将所有输入文件的.bss section合并成一个.bss section;该段通常存放全局未初始化变量

. = ALIGN(4);表示下面的段4字节对齐

连接器每读完一个section描述后, 将定位器符号的值增加该section的大小。


来看下,Makefile应该如何写:


# CORTEX-A9 PERI DRIVER CODE# VERSION 1.0# ATHUOR 一口Linux# MODIFY DATE# 2020.11.17  Makefile

#=================================================#

CROSS_COMPILE = arm-none-linux-gnueabi-NAME =start

CFLAGS=-mfloat-abi=softfp -mfpu=vfpv3 -mabi=apcs-gnu -fno-builtin  -fno-builtin-function -g -O0 -c                                   

LD = $(CROSS_COMPILE)ld

CC = $(CROSS_COMPILE)gcc

OBJCOPY = $(CROSS_COMPILE)objcopy

OBJDUMP = $(CROSS_COMPILE)objdump

OBJS=start.o  main.o

#================================================#

all:  $(OBJS)

$(LD)  $(OBJS) -T map.lds -o $(NAME).elf

$(OBJCOPY)  -O binary  $(NAME).elf $(NAME).bin 

$(OBJDUMP) -D $(NAME).elf > $(NAME).dis 

%.o: %.S 

$(CC) $(CFLAGS) -c -o  $@ $<%.o: %.s 

$(CC) $(CFLAGS) -c -o  $@ $<%.o: %.c

$(CC) $(CFLAGS) -c -o  $@ $ rm -rf $(OBJS) *.elf *.bin *.dis *.o


编译结果如下:

编译结果

最终生成start.bin,改文件可以烧录到开发板测试,因为本例没有直观现象,后续文章我们加入其它功能再测试。

【注意】

  1. 其中交叉编译工具链arm-none-linux-gnueabi- 要根据自己实际的平台来选择,本例是基于三星的exynos-4412工具链实现的。

  2. 地址0x40008000也不是随便选择的,
    exynos4412 地址分布读者可以根据自己手里的开发板对应的soc手册查找该地址。

1)linux内核的异常向量表

linux内核的内存分布也是依赖lds文件定义的,linux内核的编译我们暂不讨论,编译好之后会再以下位置生成对应的lds文件:

arch/arm/kernel/vmlinux.lds


我们看下该文件的部分内容:
vmlinux.lds

  1. OUTPUT_ARCH(arm)制定对应的处理器;

  2. ENTRY(stext)表示程序的入口是stext。

同时我们也可以看到linux内存的划分更加的复杂,后续我们讨论linux内核,再继续分析该文件。


3. elf文件和bin文件区别:

1) ELF

ELF文件格式是一个开放标准,各种UNIX系统的可执行文件都采用ELF格式,它有三种不同的类型:

  • 可重定位的目标文件(Relocatable,或者Object File)

  • 可执行文件(Executable)

  • 共享库(Shared Object,或者Shared Library)

ELF格式提供了两种不同的视角,链接器把ELF文件看成是Section的集合,而加载器把ELF文件看成是Segment的集合。

2) bin

BIN文件是直接的二进制文件,内部没有地址标记。bin文件内部数据按照代码段或者数据段的物理空间地址来排列。一般用编程器烧写时从00开始,而如果下载运行,则下载到编译时的地址即可。


在Linux OS上,为了运行可执行文件,他们是遵循ELF格式的,通常gcc -o test test.c,生成的test文件就是ELF格式的,这样就可以运行了,执行elf文件,则内核会使用加载器来解析elf文件并执行。


在Embedded中,如果上电开始运行,没有OS系统,如果将ELF格式的文件烧写进去,包含一些ELF文件的符号表字符表之类的section,运行碰到这些,就会导致失败,如果用objcopy生成纯粹的二进制文件,去除掉符号表之类的section,只将代码段数据段保留下来,程序就可以一步一步运行。


elf文件里面包含了符号表等。BIN文件是将elf文件中的代码段,数据段,还有一些自定义的段抽取出来做成的一个内存的镜像。


并且elf文件中代码段数据段的位置并不是它实际的物理位置。他实际物理位置是在表中标记出来的。

推荐阅读

史海拾趣

Feller US公司的发展小趣事

随着市场竞争的加剧和资金问题的持续困扰,菲斯克在某一时期不得不宣布停产六周。这一决定引发了外界的广泛关注和质疑。然而,菲斯克并没有因此放弃,而是利用这段时间进行了深入的内部反思和策略调整。通过优化生产流程、降低成本以及加强与其他汽车制造商的合作,公司逐渐走出了困境,重新焕发出新的生机。

Advanced_Linear_Devices_Inc.公司的发展小趣事

在集成电路的封装领域,ALD同样展现出了强大的创新能力。公司不仅提供了塑封、PDIP、小型装(SOIC)等常见的封装形式,还开发出了密封陶瓷封装(CDIP)等高性能封装技术。这些封装技术不仅提高了集成电路的可靠性和稳定性,还降低了生产成本,为客户提供了更具竞争力的产品。

Amphenol Nexus公司的发展小趣事

作为一家专注于电气元件和连接器制造的公司,Amphenol Nexus Technologies始终致力于技术创新和产品升级。公司投入大量资源用于研发,不断推出具有创新性和高性能的新产品。例如,在高速连接器领域,Amphenol Nexus Technologies成功研发出了112G高速背板连接器,这一产品满足了人工智能等前沿技术对高速传输的需求,为公司带来了新的增长点。

DEVCON公司的发展小趣事

在竞争激烈的电子行业中,提供优质的服务是赢得客户信任的关键。DEVCON公司深知这一点,因此不断创新服务模式,提升服务质量。公司建立了完善的售后服务体系,为客户提供及时、专业的技术支持和解决方案。同时,公司还积极开展培训活动,提升员工的技能水平和服务意识。这些创新举措赢得了客户的广泛赞誉和信赖,为DEVCON公司的稳定发展提供了有力保障。

驰芯微(CHIPWISE)公司的发展小趣事

近年来,国际环境复杂多变,某些国家对我国进行“芯片限制”。然而,这一限制反而为驰芯微带来了机遇。在“芯片限制”的背景下,更多国内车企开始寻求与国内芯片企业的合作。驰芯微凭借其在车规级芯片领域的丰富经验和卓越性能,成功获得了多家车企的青睐。公司抓住这一机遇,加大了与车企的合作力度,进一步巩固了其在行业中的地位。

FOX [Fox Electronics]公司的发展小趣事

进入21世纪后,Fox Electronics意识到全球化对于企业发展的重要性。为了更好地服务全球客户,公司开始在全球范围内布局生产基地和销售网络。通过在亚洲、欧洲和北美等地设立分厂和办事处,Fox Electronics不仅缩短了交货周期,还降低了生产成本,提高了市场竞争力。同时,公司还加强了与全球供应链伙伴的合作,通过优化供应链管理,确保产品质量和交货期的稳定性。

问答坊 | AI 解惑

e芯电子技术交流4群开始启用35871678!

本帖最后由 paulhyde 于 2014-9-15 09:25 编辑 e芯电子技术交流4群开始启用35871678!谢谢支持  …

查看全部问答>

泰克的AM503B电流探头放大器有人用过吗?碰到问题了

开机的时候那个消磁按钮上的红色指示灯不停的闪,按一下会进行消磁动作,但好像不能完成消磁,数码管显示364一闪一闪的。 有时候开机一段时间后能消磁成功,有时候开机几个小时也不行。用过的DD指导一下,是有故障还是我使用问题?…

查看全部问答>

如何进行编程可以减少程序的bug?

如题,这个恐怕是大家经常遇到的问题吧? 一种方法是: 在任何时候都把“程序规模”限制在你所能够掌控的范围内。 那如果超过范围咋办?模块化——合理划分和封装细节。其实如果是自上而下的设计(通常如此),模块化设计是非常自然的事(因为 ...…

查看全部问答>

常见分辨率的简称

本帖最后由 jameswangsynnex 于 2015-3-3 20:01 编辑 Name Resolution Aspect Ratio QUXGA 3200×2400 4:3 QSXGA+ 2800×2100 4:3 QSXGA 2560×2048 5:4 WQXGA 2560×1600 16:10 QXGA 2048×1536 4:3 WUXGA ...…

查看全部问答>

有关屏蔽电阻的问题。。。。

最近看了一个电路,就是在触摸屏的四根线上,分别接了4个屏蔽电阻下拉接地。 想请教一下: 1。为什么触摸屏那四根线要下拉?我看很多触摸屏的电路,没有下拉使用也很正常啊! 2。为什么要用屏蔽电阻?普通电阻不行吗?会造成什么样的影响? 麻 ...…

查看全部问答>

如何CString 类型转换为INT?

        CString strDefault=111; 我要把111付值给int a;怎么做那?我用atoi不好使 …

查看全部问答>

VHDL中如何将两个模块中的inout互联????

VHDL中如何将两个模块中的inout互联?…

查看全部问答>

Multisim:求指教

电阻的图形符号没有,竟然是电感替代的,后面是电阻的数据,单位欧姆,这该咋弄啊?…

查看全部问答>

LM3S开发板如何做成成 web sever?

将LM3S6911开发板连接到路由器上,让外网也可以访问。是不是需要申请域名,怎么整呢?麻烦有经验的朋友指教一下。…

查看全部问答>