历史上的今天
返回首页

历史上的今天

今天是:2025年08月21日(星期四)

正在发生

2018年08月21日 | 什么叫协同芯片

2018-08-21

协同芯片(Companion chips):AI的明智选择?

作者:Imagination互联与家居互联部市场总监Simon Forrest


多年来,半导体行业一直致力于将越来越多的组件紧密的集成到单个片上系统中(SoC)。毕竟这对于庞大的应用而言是非常实用的解决方案。通过优化处理器的定位,存储器和外部设备芯片厂商能够将数据路径调整到最短,从而提高功率效率并取得更高的性能,此外还能够显著的降低成本。通过这些方法,该行业已经取得了巨大的成功,SoC几乎是我们所有消费电子产品的标准组件。

 

AI作为一种标准

 

随着更多的公司意识到利用神经网络处理各种任务(比如自然语言处理、图片识别分类)的巨大潜力,引入人工智能要素的产品数量也在稳步增加。与此同时,这些任务的处理过程正在从基于云的架构迁移到本地终端设备来实现,现在专用硬件神经网络加速器也已经嵌入到SoC器件中。

                                              image.png?imageView2/2/w/550

AI正集成到更多的SoC器件中


从语音激活的消费电子产品(比如虚拟助理)到高级的驾驶辅助系统(ADAS),集成的神经网络人工智能(AI)所面临的机会正在多个细分的市场中展开,不可否认,人工智能(AI)被认为是许多解决方案必不可少的要素。

一种方法不能适用所有

 

然而,尽管AI应用程序的数量正在不断增加,但这并不意味着集成有AI加速功能的SoC能够适用所有的场景。实际上,如果我们考虑AI能够覆盖大多数的细分市场,那么由于使用该技术的产品可能有很多不同的处理要求,自然就会产生碎片化的差异。细分的市场对于专用的SoC器件是一种挑战,因此“一刀切”通用的方案不再适用。虽然一些市场(比如智能手机、ADAS)为SoC供应商提供了大量的机会,但是很多针对AI使用的市场目前仍然比较低迷。例如某些产品可能需要AI进行语音处理或图像识别,但不一定两者都需要。同样的智能家居供应商认为将传统的智能手机SoC嵌入AI功能就集成到他们的产品中并不是很好的解决方案,因为这不符合成本效益。

认识AI协同芯片

 

现在台式机CPU和移动SoC大多都采用多核芯片,因为它们灵活的可扩展架构使其能够按需提供不同的性能,AI“协同芯片”采用类似的方法,它们不仅仅只被设计成一个,而是多个计算GPU和神经网络加速器(NNA)来为特定的应用提供足够的性能,同时确保对硅片尺寸进行优化,将芯片的成本降至最低。这些处理器会紧挨着主应用处理器(SoC)作为“协同芯片”,承载主应用处理器上的NNA内核需要处理的AI推理任务。


现在SoC供应商有机会创建一个传统的通用应用处理器,能够经济高效的适用于多个市场,同时可以配套AI协同芯片来满足一些特定应用或小众应用对于AI功能的需求。


从OEM厂商的角度来看,他们现在可以选择适当地扩展自己的产品解决方案,这取决于他们期望在整个应用方案中对于AI处理操作的开销。


image.png?imageView2/2/w/550

一个AI处理器的例子:根据不同应用NNA的数量可以灵活的增减

 

典型的协同AI SoC芯片包括负责内部事务的通用控制CPU、用于高性能计算的GPU内核(而不是专门用于处理图形和3D变换操作)以及多个NNA(神经网络加速器),根据不同的神经网络和推理引擎可灵活组合,此外还可以根据不同的任务采用不同的精度。举个例子,在双NNA系统中,其中一个NNA可以用来执行图像识别任务,将结果传递给另一个NNA之前能够识别出场景中的人脸部分,另一个NNA会将人脸部分划分为单独的特征从而识别出面部表情。

另一个例子就是汽车,对六核心的AI协同芯片进行分区,其中三个NNA(每个NNA负责不同的方面)用来识别道路上的标志,与此同时另外三个将专门负责行人检测。NNA的数量和任务的分配是根据应用的需求而确定的。这个概念可以扩展到一系列专用的AI处理器,每个处理器都会集成不同数量的NNA来满足不同任务的性能需求。

从云端到本地

 

我们已经看到了部署在云端的专用AI芯片,比如谷歌公司推出的TPU、微软公司和英特尔合作的Brainwave项目采用Stratix FPGA作为解决方案,现在这些主要用于AI的机器学习和算法的训练。

image.png?imageView2/2/w/550

典型的云端AI解决方案——太庞大了!

 

然而并不是所有的设备都会连接到云服务,面对众多不用的市场应用,业界认为至少可以把一些AI任务用本地设备自身来完成,这么多市场需求非常的复杂,正如我们之前讨论过的,没有完全通用的解决方案。业界的所有供应商都已经开始利用神经网络来实现某些特殊的需求,而且向协同AI芯片的转变有望成为AI处理解决方案又一令人兴奋的一步。


最终的结果是协同AI芯片可能会比我们预期的更加的普遍,Imagination公司在半导体行业有着超过25年的处理器内核创新经验,因此它无疑是这方面可靠的合作伙伴。


推荐阅读

史海拾趣

西安航天民芯公司的发展小趣事

西安航天民芯科技有限公司成立于XXXX年,创立初期,公司便明确了自己的发展方向——专注于集成电路设计与开发。在创始团队的带领下,公司逐步积累起深厚的技术底蕴,为后续的快速发展奠定了坚实的基础。通过不断地技术研究和创新,西安航天民芯逐渐在行业内崭露头角。

Global Components & Controls公司的发展小趣事
将挡住光线的纸拿开,观察灯光亮度的变化。如果灯光稍有变化但趋于稳定,说明RP2的调节已到位;如果亮度变化很大,则需要进一步调节RP2使灯光稍有下降直至稳定。
AnDAPT__Inc.公司的发展小趣事
接通电源后,调节RP1使灯光处于最亮状态。
HANBIT Electronics公司的发展小趣事
根据电路设计要求和实际使用需求选择合适的元件参数,如电阻的阻值、电容的容值以及可控硅的型号等。
Belden Wire & Cable公司的发展小趣事

在1902年,Joseph C. Belden在美国芝加哥创立了Belden公司,标志着这家电线电缆公司的诞生。创立初期,公司便专注于电线电缆的研发和生产,凭借其卓越的产品质量和可靠的性能,逐渐在市场上崭露头角。随着业务的发展,Belden逐渐扩大了生产规模,并增设了多个生产基地,以满足不断增长的市场需求。

固得沃克(GOODWORK)公司的发展小趣事

随着业务的不断拓展,固得沃克意识到技术升级和产能扩张的重要性。2019年,公司在江苏盐城成立了江苏固得沃克微电子科技有限公司,作为新的生产基地。该基地拥有2万平米的厂房,引进了具有国际水准的专业生产设备及先进检测仪器,并通过了ISO9001、ISO14001等国际管理体系认证。这一举措不仅提升了公司的生产能力和产品质量,还进一步巩固了其在半导体行业的地位。

问答坊 | AI 解惑

CEPB (5.0)上, Tools --> Windows CE Remote Call Profiler 工具如何使用?

CEPB (5.0)上, Tools  -->  Windows CE Remote Call Profiler 工具如何使用? (我想用它来看 开发板上EVC写的程序消耗的资源) launch --> EVC写的程序 后, 提示接收等待数据.... 但EVC写的程序的运行和消耗的资源等 数据无 ...…

查看全部问答>

USB驱动请教各位

我用DDK做了一个USB驱动,已经能正常通讯了,但是在循环写Pipe1端口,写几次驱动就不响应了,调试发现停在status = KeWaitForSingleObject( &event, Executive, KernelMode, FALSE, NULL );,以下时通讯程序,这会是什么原因呢????   & ...…

查看全部问答>

高分求51单片机的程序一份

硬件电路图已有,求程序,汇编、C语言编写均无不可。求善人帮忙,有意联系 QQ:226600569 甚急!QQ在线等…

查看全部问答>

在makeimg时出现错误,打包失败,该如何解决?

将一个应用的配置文件SL50FBgb.mnu打包到内核,在platform.bib中加入了这样一行: SL50FBgb.mnu       $(_FLATRELEASEDIR)\\SL50FBgb.mnu                  NK U ...…

查看全部问答>

EVC++下不支持GetRunningObjectTable( )函数?

在移植陆老师的SAMPLEPLAYER到WINCE下,但编译报不支持GetRunningObjectTable( )和CreateItemMoniker( )这两个函数,请问为什么?我自己导出的SDK包不全面?还是跟.NET组件加没加有关?我的SDK包没加.NET组件 ...…

查看全部问答>

STM32 v3.5固件库systick ms延时

《如何从STM32F10xxx固件库V2.0.3升级为STM32F10xxx标准外设库V3.0.0》一文中的“3.3.2 SysTick”讲到:在标准外设库中移除了SysTick的驱动,因此用户必须调用CMSIS定义的函数。CMSIS只提供了一个SysTick设置的函数,替代了STM32原有SysTick驱动的 ...…

查看全部问答>

如何从DSP和M4转到FPGA

以前我玩过DSP和M4,不知道怎么转到FPGA才好,原理图都看不懂... 怎么一个FPGA非要分成这么多个模块...…

查看全部问答>

简易数字信号传输分析仪

本帖最后由 paulhyde 于 2014-9-15 03:19 编辑 2011年国赛题简易数字信号传输分析仪中提取曼彻斯特编码的同步时钟,有没有什么好的方案??    …

查看全部问答>

STM32F767 FMC驱动TFT屏幕并成功移植EMWIN(记录一下))

本帖最后由 ihalin 于 2016-8-12 00:19 编辑 经过一段时间琢磨stm32F767用fmc来驱动屏幕发现老是不成功,后来发现原来是 F7直接用FSMC驱动MCU接口的屏会有问题的!因为Cache在搞鬼!使用MPU(内存保护单元)对SRAM区做保护才可以驱动MCU屏还有一 ...…

查看全部问答>