STM32F4和STM32F7系列的高端型号都能使用DMA2D图形加速器在LTDC显示外设上进行图形图像缓存的快速搬运,DMA2D外设在其中就相当于一个快速通道,可以将内存地址中的数据快速搬运到LTDC外设总线的地址,这种方式与用户直接操作GPU显存地址是两种不同原理,不同用途的方式,那问题来了,如果对于范围甚至是全屏刷新的话,这两种方式到底差多远的效率呢?官方的给出的数据是理想值,实际测试肯定需要借助仪器,这里我就简单使用GPIO引脚电平翻转+示波器读波形的方式进行探讨。示波器的1号输入探头接上板子并打开通道1:
使用示波器查看各种代码的延时时间,最简单的方式就是使用GPIO引脚电平翻转的方式,这里我使用了板上Arduino排针的PJ1引脚,初始化代码和寄存器翻转电平代码如下:
void PJ1_Init()
{
__HAL_RCC_GPIOJ_CLK_ENABLE();
GPIO_InitTypeDef GPIO_InitStruct;
GPIO_InitStruct.Pin = GPIO_PIN_1;
GPIO_InitStruct.Mode = GPIO_MODE_OUTPUT_PP;
GPIO_InitStruct.Pull = GPIO_NOPULL;
GPIO_InitStruct.Speed = GPIO_SPEED_FREQ_LOW;
GPIO_InitStruct.Alternate = GPIO_NOPULL;
HAL_GPIO_Init(GPIOJ, &GPIO_InitStruct);
}
GPIOJ->BSRR=0x00000002;
GPIOJ->BSRR=0x00020000;
首先看看使用直接操作显存地址画点的方式的效率,代码就是直接使用画点函数:
void fun(int color)
{
int i,j;
for(i=0;i<800;i++)
for(j=0;j<480;j++)
BSP_LCD_DrawPixel(i,j,color);
}
while (1)
{
fun(0xffffff00);
GPIOJ->BSRR=0x00000002;
fun(0xffff00ff);
GPIOJ->BSRR=0x00020000;
}
然后查看示波器波形:
可以看出,这种逐个画点方式刷全屏的延迟大概是50~60ms一帧。
之后就是直接使用BSP_LCD_Clear进行刷屏,这种方式是使用DMA2D通道进行的:
while (1)
{
BSP_LCD_Clear(0xffffff00);
GPIOJ->BSRR=0x00000002;
BSP_LCD_Clear(0xffff00ff);
GPIOJ->BSRR=0x00020000;
}
查看示波器波形,有明显提升,大概是7~8ms一帧,效率差不多是画点方式的7倍:
最后就是今天的重头戏,使用DMA2D刷自定义图像数据,这边官方的代码存在一些问题,官方的代码支持ARGB888 RGB888 RGB565三种图像颜色格式,但是我都试了一遍,只有RGB888和RGB565是可以正常刷出的,原因不知,但是没有关系,因为BMP格式的数组最常用的也就是RGB888 24位色,ARGB8888即使不支持也没有关系,这边我改造了一下官方给的BMP文件数据刷屏函数,改成直接用BMP数组做参数,不引入文件头数据:
void BSP_LCD_DrawBuffer(int Xpos, int Ypos,int width,int height,int bit_pixel,uint8_t *buf)
{
uint32_t index = 0;
uint32_t Address;
uint32_t InputColorMode = 0;
Address = 0xC0000000 + (((800*Ypos) + Xpos)*(4));
switch(bit_pixel)
{
case 16: InputColorMode = DMA2D_INPUT_RGB565; break;
case 24:InputColorMode = DMA2D_INPUT_RGB888; break;
case 32: InputColorMode = DMA2D_INPUT_ARGB8888; break;
}
buf += (index + (width * (height - 1) * (bit_pixel/8)));
for(index=0; index < height; index++)
{
LL_ConvertLineToARGB8888((uint32_t *)buf, (uint32_t *)Address, width, InputColorMode);
Address+= (BSP_LCD_GetXSize()*4);
buf -= width*(bit_pixel/8);
}
}
-Xpos和Ypos是图像起始XY坐标
-width和height是图像宽度和高度
-bit_pixel是位长,可选参数16,24和32
-uint8_t *buf是图像数据,取自Image2Lcd软件
DMA2D默认方式是从下至上扫描,因此选项要选中
在Image2Lcd软件中设置图像的宽和高分别为600和360,这是因为假如全屏显示的话没办法同时存下两张图片的数据在Flash中,因此只能选宽高各3/4大小的图片,设置完成之后同样在主循环中刷新两张图片的图像数据:
while (1)
{
BSP_LCD_DrawBuffer(100,60,600,360,24,(uint8_t *)image1);
GPIOJ->BSRR=0x00000002;
BSP_LCD_DrawBuffer(100,60,600,360,24,(uint8_t *)image2);
GPIOJ->BSRR=0x00020000;
}
示波器波形显示,可以看出不管是全屏800*480*24的缓存数据,还是600*360*24的小图片,DMA2D传输效率都不会有比较明显的差异,都是7~8ms一帧。
最后放上全屏显示图片的效果:
最后要重点说明一点,上述的所有测试均在主频200MHz下进行,且LTDC总线主频也直接按照官方DMA2D的默认参数,一般不推荐使用比官方更快的倍频,因为很有可能会导致画面撕裂。
本帖最后由 donatello1996 于 2020-7-19 18:51 编辑引用: dcexpert 发表于 2020-7-19 16:16 很好的测试,就是代码好像没有正常显示出来。
已经修改过来了
这个评测的内容丰富啊!
写的很好,可以上传工程代码吗?