[MCU] [先楫HPM6750测评之九]细说性能提升的优化方法

RCSN 2022-6-4 23:33 楼主

在之前的coremark跑分贴子上，在flash和ram运行的性能大致一样，主要的原因还是代码空间小于32K，这刚好是cache的空间范围内，hpm6570有32K ICACHE和32K DCACHE，性能上是最高的，所以跑分上，两者并没有太大的差距。

但是，如果代码空间超过了32K，这时候cache总会有用满的时候，也会有不命中的情况下，这时候需要考虑的正是系统资源和编译整合利用。

下面以littlevgl的benchmark跑分例子要进行性能提升的一个验证方法，当然这仅仅作为参考，并不能决定大多数应用场景。

由于上个贴子说明了SPI的一点缺陷，会导致DMA的辅助功能提升并不大，在实际跑lvgl的时候，code放在flash，编译器使用segger，代码缺省优化，也其实没优化的情况下，生成的代码如下：

那么按照这样烧录进去，weightied fps大概是120多左右

这是有点低了，先从lvgl的配置上去优化，lvgl的刷新周期，从30fps最大刷新率改为100fps刷新率，提升上也并不是很大，大概在160左右变动。

那么开O3优化的效果又是如何，再次烧录进去，weightied fps大概是174多左右

当然也试了以下方法，实验过程也忘了拍照，但是其实效果性能并没有提升多少，也就180左右变动

1、改为全尺寸双缓冲，但是其实这种对MCU屏幕有用，对于SPI屏幕上，效果并没多少。

2、改为非全尺寸双缓冲，大概五分之一局部刷新。

3、改为单缓冲局部刷新和单缓冲全尺寸刷新，效果均不大。

于是试着找了官方的技术，放假期间的，技术也在中午跟着我远程调试了下，换为GCC编译器，以及开启了相关优化，优化提升也不明显，大概也是180fps变动。

在调试的过程中，有个idea让楼主茅塞顿开，也就是官方技术建议就是把中断isr放在ram运行，但实际提升也不大。

于是楼主照着这个思路来看下性能有没有增加，也就是把核心的代码加载到ram中运行。好在与hpm6750有足够的RAM来加载，根据手册可知道，两核心有SLV各512K，SRAM一共1M，这是足够加载很多核心代码。

说干就干，在代码上去实现的话，可以使用ATTR_RAMFUNC修饰符放在定义的函数前面，这样编译的时候就会加载到RAM运行。

在实际调试中，单纯几个函数的修饰并不能解决问题。也不可能去手动一个一个修饰，好在与SES可以可视化去操作加载。从ATTR_RAMFUNC，Link文件可看到。

ATTR_RAMFUNC是把函数放在了section的.fast中，

从Link可看到，fast是放在了ILM_SLV的256K空间中。

于是我们可以参考Link，自己在copy个link,把fast放在更大的RAM上，也就是SRAM上

那么ses如何去加载这些函数到RAM上了，跟keil类似

右键点击需要加载的文件夹，选择options

选择code段改为.fast，这样就可以一次搞定加载所有需要到RAM运行的函数。

根据之前的调试性能，再加载核心的放在RAM中运行，烧录代码进去，奇迹的时刻，从122fps提升到286，整整提升了两倍性能，这已经对于SPI这个稍微缺陷IP，足够有帮助了。

于此总结：

1、在从代码优化，编译器优化上，可以提高性能。

2、在1的基础上，随着代码空间的增多，32k cache总有用完的时候，xip flash 也会有所损失性能，最好就是可以把主要的代码加载到RAM中运行，更可提高性能。

3、除了32K cache的加持，内部RAM整合也有足够2M，对于系统而言，是足够性能整合的。

1084534438 欢迎交流 [加油，一切皆有可能]

回复评论（1）

沙发 Jacktang

在xip flash 有损失性能时，把主要的代码加载到RAM中运行，更可提高性能，建议收藏

点赞 2022-6-5 07:29

最新活动

免费申请 | 上百份MPS MIE模块，免费试用还有礼！

TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~

安世半导体理想二极管与负载开关，保障物联网应用的稳健高效运行

随便看看

PFC电感设计计算.pdf

TI 博文：如何调节低电压隔离电源

EEWORLD大学堂----python中文视频教程

求救：YLP2410的usb鼠标在wince下有时用不了？

各位新年好,有介绍工作的没

【Atmel SAM R21创意大赛周计划】+物联网小区智能网盒1周点LED EDBG升级失败解决

请问现在主流JPEG硬件解码器的速度是多少

坐公交没有硬币没有公交卡你怎么办？

求一低功耗的长按开关电路

语音存储与回放代码

福禄克有奖直播｜新型8.5位数字多用表技术发展及应用报名中！

lstrcpyn(...)在EVC下的模拟器下无法用怎么解决？

中国 IC 设计公司排行榜

中国电子科学研究院招聘【嵌入式】【算法】等

TI Designs参考设计库精选，设计套装免费申请！

RL78单片机Timer

【智能网络台灯】6. ESP32-S2解决RAM空间开销过大的问题

请问大家学嵌入式Linux多久了？调查：本人已经9个年头了。

2009年全国大学生电子设计竞赛工作总结报告

想自己做个可编程的闪字风扇，LED供电的。。新手求教啊

京公网安备 11010802033920号

写回复

[MCU] [先楫HPM6750测评之九]细说性能提升的优化方法

回复评论 （1）

沙发 Jacktang

回复评论（1）