[讨论] 【STM32F769Discovery开发板试用】关于DMA2D刷屏的效率探讨和应用

donatello1996   2020-7-19 15:45 楼主

         STM32F4和STM32F7系列的高端型号都能使用DMA2D图形加速器在LTDC显示外设上进行图形图像缓存的快速搬运,DMA2D外设在其中就相当于一个快速通道,可以将内存地址中的数据快速搬运到LTDC外设总线的地址,这种方式与用户直接操作GPU显存地址是两种不同原理,不同用途的方式,那问题来了,如果对于范围甚至是全屏刷新的话,这两种方式到底差多远的效率呢?官方的给出的数据是理想值,实际测试肯定需要借助仪器,这里我就简单使用GPIO引脚电平翻转+示波器读波形的方式进行探讨。示波器的1号输入探头接上板子并打开通道1:

IMG_20200719_145148.jpg IMG_20200719_145141.jpg

使用示波器查看各种代码的延时时间,最简单的方式就是使用GPIO引脚电平翻转的方式,这里我使用了板上Arduino排针的PJ1引脚,初始化代码和寄存器翻转电平代码如下:

void PJ1_Init()
{
  __HAL_RCC_GPIOJ_CLK_ENABLE();
	GPIO_InitTypeDef GPIO_InitStruct;
  GPIO_InitStruct.Pin = GPIO_PIN_1;
  GPIO_InitStruct.Mode = GPIO_MODE_OUTPUT_PP;
  GPIO_InitStruct.Pull = GPIO_NOPULL;
  GPIO_InitStruct.Speed = GPIO_SPEED_FREQ_LOW;
  GPIO_InitStruct.Alternate = GPIO_NOPULL;
  HAL_GPIO_Init(GPIOJ, &GPIO_InitStruct);	
	
}
GPIOJ->BSRR=0x00000002;
GPIOJ->BSRR=0x00020000;

首先看看使用直接操作显存地址画点的方式的效率,代码就是直接使用画点函数:

void fun(int color)
{
	int i,j;
	for(i=0;i<800;i++)
		for(j=0;j<480;j++)
			BSP_LCD_DrawPixel(i,j,color);
}

while (1)
{   

		fun(0xffffff00);
		GPIOJ->BSRR=0x00000002;
		fun(0xffff00ff);
		GPIOJ->BSRR=0x00020000;
}

 

然后查看示波器波形:

IMG_20200719_145152.jpg 3.gif

可以看出,这种逐个画点方式刷全屏的延迟大概是50~60ms一帧。

之后就是直接使用BSP_LCD_Clear进行刷屏,这种方式是使用DMA2D通道进行的:
 

while (1)
{   
		BSP_LCD_Clear(0xffffff00);
		GPIOJ->BSRR=0x00000002;
		BSP_LCD_Clear(0xffff00ff);
		GPIOJ->BSRR=0x00020000;
}

查看示波器波形,有明显提升,大概是7~8ms一帧,效率差不多是画点方式的7倍:

IMG_20200719_150139.jpg

最后就是今天的重头戏,使用DMA2D刷自定义图像数据,这边官方的代码存在一些问题,官方的代码支持ARGB888 RGB888 RGB565三种图像颜色格式,但是我都试了一遍,只有RGB888和RGB565是可以正常刷出的,原因不知,但是没有关系,因为BMP格式的数组最常用的也就是RGB888 24位色,ARGB8888即使不支持也没有关系,这边我改造了一下官方给的BMP文件数据刷屏函数,改成直接用BMP数组做参数,不引入文件头数据:

void BSP_LCD_DrawBuffer(int Xpos, int Ypos,int width,int height,int bit_pixel,uint8_t *buf)
{
  uint32_t index = 0;
  uint32_t Address;
  uint32_t InputColorMode = 0;

  Address = 0xC0000000 + (((800*Ypos) + Xpos)*(4));

	switch(bit_pixel)
	{
		case 16: InputColorMode = DMA2D_INPUT_RGB565; break;
		case 24:InputColorMode = DMA2D_INPUT_RGB888; break;
		case 32: InputColorMode = DMA2D_INPUT_ARGB8888; break;
	}
  
  buf += (index + (width * (height - 1) * (bit_pixel/8)));

  for(index=0; index < height; index++)
  {
    LL_ConvertLineToARGB8888((uint32_t *)buf, (uint32_t *)Address, width, InputColorMode);

    Address+=  (BSP_LCD_GetXSize()*4);
    buf -= width*(bit_pixel/8);
  }
}

-Xpos和Ypos是图像起始XY坐标
-width和height是图像宽度和高度
-bit_pixel是位长,可选参数16,24和32
-uint8_t *buf是图像数据,取自Image2Lcd软件

3.jpg 2.bmp 2.bmp 2.bmp

DMA2D默认方式是从下至上扫描,因此选项要选中

在Image2Lcd软件中设置图像的宽和高分别为600和360,这是因为假如全屏显示的话没办法同时存下两张图片的数据在Flash中,因此只能选宽高各3/4大小的图片,设置完成之后同样在主循环中刷新两张图片的图像数据:

while (1)
 {   
		BSP_LCD_DrawBuffer(100,60,600,360,24,(uint8_t *)image1);
		GPIOJ->BSRR=0x00000002;
		BSP_LCD_DrawBuffer(100,60,600,360,24,(uint8_t *)image2);
		GPIOJ->BSRR=0x00020000;
}

示波器波形显示,可以看出不管是全屏800*480*24的缓存数据,还是600*360*24的小图片,DMA2D传输效率都不会有比较明显的差异,都是7~8ms一帧。

IMG_20200719_150406.jpg 4.gif

最后放上全屏显示图片的效果:

IMG_20200719_152708.jpg 2.bmp

2.bmp 2.bmp 2.bmp 2.bmp

最后要重点说明一点,上述的所有测试均在主频200MHz下进行,且LTDC总线主频也直接按照官方DMA2D的默认参数,一般不推荐使用比官方更快的倍频,因为很有可能会导致画面撕裂。

本帖最后由 donatello1996 于 2020-7-19 18:51 编辑
  • 3.bmp

回复评论 (5)

很好的测试,就是代码好像没有正常显示出来。

点赞  2020-7-19 16:16
引用: dcexpert 发表于 2020-7-19 16:16 很好的测试,就是代码好像没有正常显示出来。

已经修改过来了

点赞  2020-7-19 18:51

这个评测的内容丰富啊!

点赞  2020-7-22 23:37

可以可以,这个评测有点货。

默认摸鱼,再摸鱼。2022、9、28
点赞  2020-7-23 21:35

写的很好,可以上传工程代码吗?

点赞  2024-9-19 20:38
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 京公网安备 11010802033920号
    写回复