历史上的今天
返回首页

历史上的今天

今天是:2024年11月23日(星期六)

2020年11月23日 | SiMa.ai阐述如何利用MLSoC实现可伸缩边缘处理平台

2020-11-23 来源:EEWORLD

本文作者:SiMa.ai业务开发和系统应用副总裁Kavitha Prasad


边缘AI设备的生命周期可能长达数年甚至数十年,需要设备支持处理未来的机器学习(ML)算法。  


尽管我们可能还不知道这些算法会是什么样子,但可以肯定的是,它们将比我们目前为边缘AI设备提供的工作负载更加复杂,要求更高。


如今,大多数边缘AI设备的每瓦功率约为4 TOPS至5 TOPS。这对于基本的ML例程已经足够了,但是与AI计算的数据中心产品相比无可比拟。


降低边缘AI的功率曲线


SiMa.ai的初衷是缩小这种性能鸿沟:重新定义当今与边缘AI相关的性能。然而,要在边缘AI设备中达到任何类似于云性能的性能,都需要显着降低功耗,或者说,是显着提高每瓦TOPS。 


考虑到这一目标,我们开发了MLSoC(片上机器学习系统)平台,目标是每瓦10 TOPS的峰值。对于5瓦的嵌入式电源,我们的ML加速器最多可以达到50个TOPS。这足以支持传统上需要在被动冷却的边缘AI设备中实现云性能的AI工作负载。 


我们将异构MLSoC设计为能够处理客户一段时间后创建的工作负载,但是还能够针对未来尚未确认的工作负载进行验证。与数据中心不同,数据中心可以随着新的组件迭代进入市场而进行升级,而内置在边缘AI设备中的硬件则是在将其放入芯片的那一天设置的。


我们针对这一挑战的解决方案将Arm的传统计算IP与我们自己的机器学习加速器和专用视觉加速器相结合。作为低功耗计算的市场领导者,Arm IP是构建MLSoC的安全平台的明显选择。在与客户紧密合作以定义其应用程序的计算要求之后,我们选择了Arm Cortex -A65 CPU:这是很大程度上取决于客户需求(从性能到软件工具链)的决策。   


尽管SiMa.ai的MLSoC能够处理诸如自然语言处理(NLP)之类的各种ML工作负载,但最初已针对计算机视觉应用进行了优化。从终端摄像头到自拍,计算机视觉已经成为许多边缘AI用例的核心,并且我们相信,在高端监控,人群控制和热扫描等未来应用中,计算机视觉的应用只会增加。


计算机视觉为终端AI开启了未来的复杂用例


将视觉加速器与ML加速器结合使用还可以确保MLSoC能够处理复杂的工作负载,例如来自多个传感器的传感器融合,这使其能够在从工业自动驾驶到工业IoT环境中的自动驾驶系统中发挥作用,从消费者自动驾驶汽车到自动驾驶机器人。我们还预见了MLSoC在航空航天和国防领域中的作用。 


当然,这些复杂的自主工作负载需要超过50个TOPS。这就是为什么我们将MLSoC设计为模块化的原因:通过专有互连将多个机器学习加速器镶嵌结合在一起,我们可以从5瓦的50 TOP扩展到40瓦的400 TOPS。


考虑到当今的5级自动驾驶汽车原型机耗电约4千瓦,这有可能将功耗降低100倍,并大大减少物理硬件的占地面积,同时减少对主动冷却的需求。  


降低设备的功耗还有另一个很好的理由,这些设备很快将在成千上万的世界中占据一席之地。我们与之交谈的许多OEM和客户都非常清楚如何降低功耗,以便在2030年或更早之前实现碳中和。这就是我们想要设计低功耗的足够理由。


为开发人员提供所需的工具


我相信MLSoC将在边缘和边缘设备中实现低功耗AI方面发挥关键作用。但是我也知道,仅仅为以一定数量的TOPS为基准的解决方案提供Lisence是不够的。


当今市场上存在的许多解决方案都基于ResNet-50等基准来宣传其性能。但是,只有在实际条件下(即客户的工作量)可以达到的情况下,引用每秒帧数或每瓦TOPS才有意义。


我们的客户想要一件事:开发速度。他们可以多快上市。他们不想花费数月的开发周期来实现他们所承诺的性能,他们希望能够直接得到解决方案,然后使用简单而全面的工具添加自己的差异化特性。


我们计划在明年初发布MLSoC,以期在明年年底之前交付工程样品以及潜在的客户样品。但是,我们已经与客户紧密合作,以定义和构建他们的应用程序并将它们映射到我们的硬件,并且软件开发套件(SDK)将提前提供给客户。


这意味着他们将能够遍历整个流程,开发其应用程序并运行仿真,以便在芯片正式商用后,产品可以编译即用。


而且由于MLSoC以Arm技术为基础,因此我们的客户可以确保他们将拥有不仅需要构建下一代,而且还要构建许多后代的高性能,低功耗AI设备所需的软件,工具和持续支持。


推荐阅读

史海拾趣

C-MEDIA公司的发展小趣事

在2000年代初,C-MEDIA以其在音频处理领域的专业技术而知名。然而,随着市场竞争的加剧和技术的快速发展,公司意识到需要调整战略以适应市场变化。于是,C-MEDIA在与瑞昱(Realtek)达成收购协议后,决定将AC97、HD Audio板载音频芯片技术转让给Realtek,并退出板载声卡领域。这一决策使得C-MEDIA能够专注于中高端音频处理芯片的研发,进一步巩固了其在独立声卡市场的地位。

DCD [Digital Core Design]公司的发展小趣事

随着技术的不断成熟和产品线的日益丰富,DCD公司开始着手拓展市场。公司积极参与各类行业展会,与国内外客户建立了广泛的联系。同时,公司还加大了品牌推广力度,通过线上线下多种渠道提高品牌知名度。经过几年的努力,DCD公司的产品在市场上逐渐获得了认可,公司也因此在电子行业中崭露头角。

Continental Industries公司的发展小趣事

在电子行业的发展过程中,Continental Industries注重与其他企业的合作与共赢。公司与多家知名企业建立了长期稳定的合作关系,共同开展技术研发和产品创新。通过资源共享和优势互补,双方实现了互利共赢,共同推动了电子行业的进步。

ERA Transformers公司的发展小趣事

在国内市场取得一定成功后,ERA Transformers公司开始将目光投向国际市场。为了打开国际市场,公司积极参加国际电子展会和交流活动,与多家国际知名企业建立了联系。通过深入了解国际市场需求和标准,公司对产品进行了针对性的改进和优化。经过一段时间的努力,ERA Transformers公司的产品成功打入了国际市场,并获得了良好的销售业绩和口碑。

Acme Electric Corporation公司的发展小趣事

为了保持技术领先地位和市场竞争力,ERA Transformers公司非常重视创新与研发工作。公司每年都会投入大量资金用于新产品的研发和技术创新。在一次研发项目中,公司成功开发出了一种具有超高能效和极低损耗的新型变压器。这款产品的问世立即引起了市场的广泛关注,并成功获得了多项国内外专利。持续的创新与研发使得ERA Transformers公司在电子行业中始终保持着领先地位。

DESCO公司的发展小趣事

随着防静电产品市场的不断扩大,DESCO公司开始着手进行市场拓展和品牌塑造。公司通过参加国际展会、举办技术研讨会等方式,积极向全球客户展示其防静电产品的技术优势和应用前景。同时,DESCO还加大了品牌宣传力度,提高了品牌知名度和美誉度。这些举措为公司在全球范围内赢得了大量忠实客户,市场份额持续增长。

问答坊 | AI 解惑

在Keil C51 uVision3 中调试w77E58如何设置才能使用片上的1K外部存贮器呀?

伟福V8仿真调试Winbond77E58不能正常使用片上1K外部存贮器的问题: 我用伟福V8/L仿真调试Winbond77E58板子, W77E58有片上1K外部存贮器,我不知是我的编译环境设置不对, 还是伟福不能仿真片上1K外部存贮器?在下面的程序中,将 int xdata i ...…

查看全部问答>

嵌入式程序运行时,硬件CPU空闲多少算正常状态?

嵌入式程序运行时,硬件CPU空闲多少算正常状态? ppc MPC8541 VxWorks…

查看全部问答>

ucosII上开发pdf查看应用程序

想在ucosII上开发一款pdf查看程序(平台君正 Xburst MIPS jz4740),现有Foxit Embedded PDF SDK可惜不免费!!!!!!!!! 总不能从头开发吧,难度太了点吧!!可有免费的库!!!推荐一个!!…

查看全部问答>

VS2005 调试问题

vs2005 编译发布成功,但弹出“unable to start debugging”这个问题怎么解决呢?先感谢各位回帖者,谢谢…

查看全部问答>

应届毕业生如何进军华为?

应届毕业生如何进军华为? 有没有在华为工作的前辈? 请指点指点,万分感谢!!!!…

查看全部问答>

【求助】74HC165的操作,只能控制一个按键,其他的控制不了,搞不明白

#define PL P2_3//SHIFT/LOAD引脚 #define CLOCK P2_4 #define SETBSC P2_5//OUTPUT QH引脚 read74hc165m() {uchar basic,c; PL=1; nop(); PL=0;//使能端为低电平时8位数据进入寄存器 nop(); PL=1;//高电平数据锁存,同时165数据自动 ...…

查看全部问答>

申请LM3S8962

三 书包小帮手  它的功能简单,却有很大的用处。我们大学生常常忘记星期几上什么课,几点上,教室在哪儿,老师的名字,电话等。它就像一个学习小管家,功能简单,外形小巧,可以放进书包上的挂饰,娃娃等,它采用防水功能。 它有个显示 ...…

查看全部问答>

万利EK-STM32F改了板子,资料怎么还是老的?

刚刚收到货,是两颗STM32芯片,ST3210-LK1 Rev.E板子和原理图根本就对不上网站上也没找到新的资料郁闷啊…

查看全部问答>

帮我看看STM32F103做RTC时的问题

我做了个RTC。。初始化时间然后查询出来都是正常的。。但是设置的时候代码如下: void RTC_WaitForLastTask(void) {   /* Loop until RTOFF flag is set */   while ((RTC->CRL & RTC_FLAG_RTOFF) == (u16)RESET) ...…

查看全部问答>