历史上的今天
返回首页

历史上的今天

今天是:2025年08月04日(星期一)

正在发生

2021年08月04日 | 21.从0学ARM-为什么使用结构体效率会高?一文给你讲透

2021-08-04 来源:eefocus

作为过来人,我发现很多程序猿新手,在编写代码的时候,特别喜欢定义很多独立的全局变量,而不是把这些变量封装到一个结构体中,主要原因是图方便,但是要知道,这其实是一个不好的习惯,而且会降低整体代码的性能。


另一方面,最近有幸与大神【公众号:裸机思维】的傻孩子交流的时候,他聊到:“其实Cortex在架构层面就是更偏好面向对象的(哪怕你只是使用了结构体),其表现形式就是:Cortex所有的寻址模式都是间接寻址——换句话说一定依赖一个寄存器作为基地址。


举例来说,同样是访问外设寄存器,过去在8位和16位机时代,人们喜欢给每一个寄存器都单独绑定地址——当作全局变量来访问,而现在Cortex在架构上更鼓励底层驱动以寄存器页(也就是结构体)为单位来定义寄存器,这也就是说,同一个外设的寄存器是借助拥有同一个基地址的结构体来访问的。”


以Cortex A9架构为前提,下面一口君详细给你解释为什么使用结构体效率会更高一些。


一、全局变量反汇编

1. 源文件

gcd.s


.text.global _start

_start:

ldr sp,=0x70000000         /*get stack top pointer*/

b main


main.c


/*

 * main.c

 *

 *  Created on: 2020-12-12

 *      Author: pengdan

 */int xx=0;int yy=0;int zz=0;int main(void){

xx=0x11;

yy=0x22;

zz=0x33;while(1);return 0;}


map.lds


OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/OUTPUT_ARCH(arm)ENTRY(_start)SECTIONS{. = 0x40008000;. = ALIGN(4);.text      :{

gcd.o(.text)*(.text)}. = ALIGN(4);.rodata : 

{ *(.rodata) }. = ALIGN(4);.data : 

{ *(.data) }. = ALIGN(4);.bss : { *(.bss) }}


Makefile


TARGET=gcd

TARGETC=main

all:

arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGETC).o  $(TARGETC).c

arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGET).o $(TARGET).s

arm-none-linux-gnueabi-gcc -O1 -g -S -o $(TARGETC).s  $(TARGETC).c

arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds  -o  $(TARGET).elf 

arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin

arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis


clean:

rm -rf *.o *.elf *.dis *.bin


【交叉编译工具,自行搜索安装】


2. 反汇编结果:

全局变量汇编指令
由上图可知,每存储1个int型全局变量需要8个字节,

literal pool (文字池)占用4个字节

literal pool的本质就是ARM汇编语言代码节中的一块用来存放常量数据而非可执行代码的内存块。

使用literal pool (文字池)的原因


当想要在一条指令中使用一个 4字节长度的常量数据(这个数据可以是内存地址,也可以是数字常量)的时候,由于ARM指令集是定长的(ARM指令4字节或Thumb指令2字节),所以就无法把这个4字节的常量数据编码在一条编译后的指令中。此时,ARM编译器(编译C源程序)/汇编器(编译汇编程序) 就会在代码节中分配一块内存,并把这个4字节的数据常量保存于此,之后,再使用一条指令把这个4 字节的数字常量加载到寄存器中参与运算。


在C源代码中,文字池的分配是由编译器在编译时自行安排的,在进行汇编程序设计时,开发者可以自己进行文字池的分配,如果开发者没有进行文字池的安排,那么汇编器就会代劳。


bss段占用4个字节

每访问1次全局变量,总共需要3条指令,访问3次全局变量用了12条指令。
访问全局变量xx

14. 通过当前pc值40008018偏移32个字节,找到xx变量的链接地址40008038,然后取出其内容40008044存放在r3中,该值就是xx在bss段的地址15. 通过将立即数0x11即#17赋值给r216. 将r2的内让那个写入到r3对应的指向的内存,即xx标号对应的内存中


二、结构体反汇编

1. 修改main.c如下:

 /*

  2  * main.c                                                           

  3  *

  4  *  Created on: 2020-12-12

  5  *      Author: 一口Linux

  6  */

  7 struct

  8 {

  9     int xx;

 10     int yy;

 11     int zz;

 12 }peng;

 13 int main(void)

 14 {

 15     peng.xx=0x11;

 16     peng.yy=0x22;

 17     peng.zz=0x33;

 18 

 19     while(1);

 20     return 0;

 21 }


2. 反汇编代码如下:

结构体变量的反汇编

由上图可知:


结构体变量peng位于bss段,地址是4000802c

访问结构体成员也需要利用pc找到结构体变量peng对应的文字池中地址40008028,然后间接找到结构体变量peng地址4000802c

与定义成3个全局变量相比,优点:


结构体的所有成员在literal pool 中共用同一个地址;而每一个全局变量在literal pool 中都有一个地址,节省了8个字节。

访问结构体其他成员的时候,不需要再次装载基地址,只需要2条指令即可实现赋值;访问3个成员,总共需要7条指令,节省了5条指令

彩!


所以对于需要大量访问结构体成员的功能函数,所有访问结构体成员的操作只需要加载一次基地址即可。


使用结构体就可以大大的节省指令周期,而节省指令周期对于提高cpu的运行效率自然不言而喻。


所以,重要问题说3遍


尽量使用结构体

尽量使用结构体

尽量使用结构体


三、继续优化

那么指令还能不能更少一点呢?

答案是可以的,

修改Makefile如下:


TARGET=gcd                                                                                

TARGETC=main

all: arm-none-linux-gnueabi-gcc -Os   -lto -g -c -o $(TARGETC).o  $(TARGETC).c

     arm-none-linux-gnueabi-gcc -Os  -lto -g -c -o $(TARGET).o $(TARGET).s

     arm-none-linux-gnueabi-gcc -Os  -lto -g -S -o $(TARGETC).s  $(TARGETC).c

     arm-none-linux-gnueabi-ld   $(TARGETC).o    $(TARGET).o -Tmap.lds  -o  $(TARGET).elf

     arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin

     arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis

clean: rm -rf *.o *.elf *.dis *.bin


仍然用第二章的main.c文件


执行结果

可以看到代码已经被优化到5条。


14. 把peng的地址40008024装载到r3中15. r0写入立即数0x1116. r1写入立即数0x2217. r0写入立即数0x3318. 通过stm指令将r0、r1、r2的值顺


推荐阅读

史海拾趣

3D PLUS公司的发展小趣事

在电子行业的浪潮中,3D PLUS公司以其前瞻性的技术视角,率先投身于3D技术的研发。公司初期便聚焦于3D扫描技术的突破,成功开发出全自动彩色桌面型3D扫描仪,该设备能够在短短几分钟内实现实物向数字的转变,为行业带来了前所未有的高效与便捷。这一创新产品的推出,不仅迅速获得了市场的认可,更在行业内树立了3D PLUS的技术领先地位。

EREM公司的发展小趣事

随着全球市场的不断融合,EREM公司开始寻求国际合作机会。通过与国外知名企业的合作,EREM不仅将产品销售到了全球各地,还学到了许多先进的管理经验和技术。同时,EREM也积极参与国际展览和交流活动,提升了品牌知名度和影响力。这些努力使得EREM在国际市场上逐渐崭露头角。

EPIC公司的发展小趣事

1998年,Epic Games发布了一款名为“虚幻”的3D第一人称射击游戏。这款游戏不仅游戏内容新颖,更引人注目的是它背后完全自主开发的3D游戏引擎。这个引擎后来被称为“虚幻引擎”,并成为了Epic Games的核心技术之一。随着游戏的成功,虚幻引擎也逐渐受到了业界的关注。许多其他游戏开发商开始采用这款引擎来开发自己的游戏,从而使得Epic Games在游戏引擎领域取得了显著的商业成功。

ZTE高新兴(Gosuncn)公司的发展小趣事

随着公司的发展,Epic Games开始通过收购和投资来扩展其业务范围。2007年8月20日,Epic Games收购了一家位于波兰的游戏开发商People Can Fly,并成为其第一大股东。这次收购不仅为Epic Games带来了更多的开发资源,也使其在游戏开发领域的实力得到了进一步提升。此外,Epic Games还积极投资其他有潜力的游戏开发商和团队,以推动整个游戏行业的创新和发展。

Ampex Data Systems Group公司的发展小趣事

随着公司的发展,Epic Games开始通过收购和投资来扩展其业务范围。2007年8月20日,Epic Games收购了一家位于波兰的游戏开发商People Can Fly,并成为其第一大股东。这次收购不仅为Epic Games带来了更多的开发资源,也使其在游戏开发领域的实力得到了进一步提升。此外,Epic Games还积极投资其他有潜力的游戏开发商和团队,以推动整个游戏行业的创新和发展。

EXXELIA Group公司的发展小趣事

1998年,Epic Games发布了一款名为“虚幻”的3D第一人称射击游戏。这款游戏不仅游戏内容新颖,更引人注目的是它背后完全自主开发的3D游戏引擎。这个引擎后来被称为“虚幻引擎”,并成为了Epic Games的核心技术之一。随着游戏的成功,虚幻引擎也逐渐受到了业界的关注。许多其他游戏开发商开始采用这款引擎来开发自己的游戏,从而使得Epic Games在游戏引擎领域取得了显著的商业成功。

问答坊 | AI 解惑

AD9280 datasheet

现在在用ADI的模拟器件,不知那位大侠能指点一下? 输入希望是-20V~+20V的。谢谢了…

查看全部问答>

verilog金牌教程

大家可以看卡啊,很纯粹…

查看全部问答>

集思广益,wince设备降功耗问题!!!

我现在做的是一个PND设备,CPU是pxa270,OS是wince 5.0. 目前的我设备屏幕亮度调整适中,系统起来之后消耗电流在260mA左右,一段时间自动关闭屏幕后(useridle状态)电流在200mA左右,但是这个2个电流都还比较大,想尽可能的把它降下来,请问大家有 ...…

查看全部问答>

单片机串口控制TFT(采用通用TFT液晶驱动)

推荐一款TFT真彩液晶驱动,特点如下 1、使用M600开发真彩色显示产品,投入最低、开发进度最快-真正的低成本 ---零售价格人民币298.00元; 2、采用串口(RS232/TTL)方式,您只需编写简单的串口通信程序就可以实 现各种(动态LOGO显示、精美 ...…

查看全部问答>

开发板买来后如何练习 写驱动 写BSP?

最近想买一款2440的开发板,为了学习WinCE嵌入式开发,但是目前还有几个疑问,开发板附带资料中的驱动是不是直接可以使用,直接能让硬件很协调的跑在WinCE下么,如果是,那么我想学习WinCE驱动开发,买开发板能学些什么呢?看看它的代码是怎么跑的么 ...…

查看全部问答>

这里有使用立宇泰ARMSYS2410的朋友吗?

我需要一份立宇泰的WINCE5.0 的支持3.5寸液晶的BSP。谁有的麻烦发到我的邮箱:wogoyixikexie@163.com真的很需要,我的板子是06年买的,立宇泰不给新的。好郁闷。液晶驱动搞不定,…

查看全部问答>

ds1085操作的c代码

maxim的时钟芯片ds1085,哪位有使用经验?提供下读写的代码,100分奉上。 …

查看全部问答>

看电脑配置大家给各个价

我准备把自己电脑卖了,可又不知道给好多,我买的时候是4500,现在一台这个配置新的3760,我用了一年,大家看卖好多合适,谢谢! CPU: AMD Sempron 2800+ 主板: 昂达 N61G 显卡: NVIDIA 6100集成显卡 内存: 金士顿 512M 硬盘: 西部 ...…

查看全部问答>

镍氢电池充电器的三阶段式充电方式的设计,求电路图或设计思路

同时对2节镍氢电池进行并行充电。电源电路输出最大功率5W。当单节电池电压大于1.3V时停止充电,并指示充电完成。当充电电池短路时具有短路保护功能。 电池充电分为3阶段,第一阶段电池电压0.9V-1V时,充电电流控制在300mA,第二阶段电池电压在1V-1 ...…

查看全部问答>

做了快STM32F417的板子

春节后把重心从freescale的ARM M4 kinetis调整到stm32F4xx上;目前虽然ST的M4新出来,价格贵,未知BUG也不确定,但还是打算早点熟悉,相信后续价格会降下来。原本只是想做stm32f207的板子,但和代理商交流了下,发现stm32f2xx系列根本就是个过渡产 ...…

查看全部问答>