ARM处理器的浮点运算单元（FPU）

2016-03-31 来源：eefocus

浮点运算单元(FPU)简介

Float Point Unit，浮点运算单元是专用于浮点运算的协处理器，在计算领域，例如三角函数以及时域频域变换通常会用到浮点运算。当CPU执行一个需要浮点数运算的程序时，有三种方式可以执行：软件仿真器（浮点运算函数库）、附加浮点运算器和集成浮点运算单元。区别于以往的ARM9处理器，目前基于ContexTM构架的ARM处理均集成了浮点运算单元。如下图Toradex ARM核心板产品所示，Nvidia TegraTM 2, TegraTM 3和 NXP/Freescale i.MX 6集成了VFPv3浮点运算单元。NXP/Freescale i.MX 7 集成了VFPv4浮点运算单元。ARM 浮点架构 (VFP) 为半精度、单精度和双精度浮点运算中的浮点操作提供硬件支持。它完全符合 IEEE 754 标准，并提供完全软件库支持，与 NEONTM 多媒体处理功能结合使用时，可增强图像应用程序的性能（如缩放、2D 和 3D 转换、字体生成和数字过滤）。

Colibri T20 和 Colibri/Apalis T30使用FPU

Colibri T20 核心板带有一个 VFPv3-D16 浮点运算单元(不带 NEON) ，而 Colibri T30 和Apalis T30 带有一个VFPv3-D32 (含有 NEON)，通过以下的配置，将能够有效的提高浮点运输的效率，运算量愈大愈明显。

benchmark program我们做了一个简单c代码的性能比较程序。我们计算了这个循环所需要的时间如下，时间越短性能越好：

Module	Time	Compile Settings
Colibri PXA320 806MHz	about 3400 ms	VS08 WinCE 6 Release 默认配置.
Colibri T20 1.0GHz	about 545 ms	VS08 WinCE 6 Debug默认配置.
Colibri T20 1.0GHz	about 315 ms	VS08 WinCE 6 Release默认配置.
Colibri T20 1.0GHz	about 80 ms	VS08 WinCE 6/7 Release settings编译器的浮点优化打开
Colibri T20 1.0GHz	about 80 ms	Linux optimized GCC settings编译器的浮点优化.
Colibri T30 1.3GHz	about 60 ms	VS08 WinCE 6/7 Release settings编译器的浮点优化打开

进入单片机查看更多内容>>

ARM 处理器浮点运算单元 FPU

上一篇:ARM Linux 更新启动画面

下一篇:ARM处理器Linux下浮点运算单元运用

热门新闻