历史上的今天
返回首页

历史上的今天

今天是:2024年12月12日(星期四)

正在发生

2018年12月12日 | Imagination出大招,增强客户与高通和英伟达GPU竞争

2018-12-12 来源: 半导体行业观察

一年前,Canyon Bridge收购了Imagination,这使得该公司在财务上稳健了很多,Imagination销售和市场营销执行副总裁David McBrien表示,我们的母公司Canyon Bridge会持续推高我们的研发水平,对一家IP公司来说,要想在市场竞争中领先,持续的投入是非常重要的。因此,我们很开心Canyon Bridge收购我们,此外,未来我们在中国的投入也会非常大。


关于竞争,David McBrien表示,移动应用是我们的主要市场,我们的目标是帮助客户跟高通在GPU上竞争,因此,要确保合作伙伴得到SoC的最佳性能,要想实现这一点,除了GPU IP之外,软件和固件也要有绝佳的性能,因此,我们在研发人员数量上会持续投入,包括我们的现场应用工程师,从而实现以最专业的态度服务我们的客户。


Imagination销售和市场营销执行副总裁David McBrien


Imagination最强的产品线是PowerVR GPU,其在手机市场呼风唤雨了多年。随着应用的发展和市场的变化,特别是手机市场的疲软,以及汽车电子和AI的兴起,使得IP厂商必须调整发展策略,以应对各种挑战。目前来看,该公司的PowerVR IP系列主要分为两部分:PowerVR GPU和PowerVR视觉和AI。


近期,Imagination推出了新的GPU、视觉和AI IP,分别是神经网络加速器PowerVR Series3NX,以及第九代(Series9)GPU系列。


神经网络加速器PowerVR Series 3NX


面向人工智能(AI)应用的神经网络加速器(NNA)PowerVR Series3NX,是在该公司去年推出的2NX基础上更新的产品。据悉,新版Series3NX提供了更强的可扩展性,使SoC制造商能够针对汽车、移动设备、智能视频监控和物联网边缘设备等一系列嵌入式市场去优化计算能力和性能。


据Imagination视觉和人工智能产品管理高级总监Neal Forse介绍,2NX是该公司第一代神经网络加速器,已有两个中国手机厂商和其签了约,国内一家主营汽车芯片厂商也选择了该公司的NNA产品。在国际厂商方面,瑞萨电子和德州仪器是Imagination的长期合作伙伴,特别是在汽车电子应用领域,还在不断加强、加深合作。手机和汽车行业是该公司重点关注的两个市场,3NX可以进一步加强和巩固其在移动和汽车行业的市场地位,进一步提升市场份额。


Imagination视觉和人工智能产品管理高级总监Neal Forse


据悉,单个Series 3NX内核的性能涵盖0.6~10万亿次操作/秒(TOPS),同时其多核实现可扩展到160TOPS以上。得益于包括无损压缩等在内的技术,Series3NX的性能可在相同的芯片面积上较上一代产品提升40%,使SoC制造商可在性能效率方面提高近60%,且带宽需求降低了35%。


作为Series3NX架构的一部分,Imagination还发布了PowerVR Series3NX-F(Flexible),以提供功能性和灵活性平衡,采用Series3NX-F的客户可以通过OpenCL来实现差异化设计。


为了迎合快速发展的市场,新的PowerVR工具也进行了多项扩展,从而能够最优化地去映射新兴的网络模型、提供灵活性和性能优化。通过使用该公司的专用深度神经网络(DNN)API,开发人员可以针对Series3NX架构以及现有PowerVR GPU编写人工智能应用程序。该API可以在多种SoC配置上工作,以便在现有设备上完成原型设计。


据Neal Forse介绍,之前2NX有两个IP核,现在的3NX有5个新的NNA核。最高达4K MAC/clk,算力可达10TOPS/s,这是单核的能力。这样的能力是通过功耗和性能方面的改进实现的,和上一代相比,它的每秒推理次数提升了70%,每平方毫米每秒的推理次数提升了40%,和上一版相比是非常大的提升。同时,每平方毫米带宽降低了35%的,系统带宽降低35%的幅度是非常大的。新特性还包括无损压缩,先进的安全使能,还有很重要的一点,就是可编程的扩展性,这让客户可以进行差异化设计。



内核方面,3NX系列是基于之前2NX的,2NX的系列里面有AX2145(1TOPS的算力)和AX2185(4.1TOPS),而3NX增加了AX3145内核,算力是1.2TOPS,还增加了一个AX3385,是5TOPS的,这两个新核在面积和性能两个维度都进行了改善,通过核的架构优化实现。此外,还有新的内核补充,一共有5个,用于低端的核算力是0.6TOPS,非常适用于功率和性能有局限的设计,这是非常重要的。中档的核是AX3365,算力是2.4TOPS,在高端部分有单核AX3595,算力可以达到10TOPS,这些算力都是单核提供的能力,通过组合还能提供更高的算力。


该公司也提供多核方案,把10TOPS算力的单核AX3595采取多核重用的方式,最高算力达到160TOPS,Neal Forse介绍,我们很多客户要求有这样的能力,要求有这样的密度。我们挑战的是160TOPS,不光是算力,还要管理和优化核之间的带宽。


与2NX相比,3NX在安全方面也有提升,客户能够在半导体层面建立原生的安全性。


3NX-F中的F代表灵活性。3NX-F把高效运算NNA的网络结合在一起,其内嵌了NNPU神经网络处理单元。这个单元是基于GPU的,但又不仅仅是GPU,通过在功耗和面积方面进行优化,利用该公司在这个领域20多年的经验积累,针对NNA加速器对GPU进行了优化。



增加可编程的扩展性可以优化硬件。当然这不是免费的。Neal Forse表示,我们要增加可编程的可扩展性,有两方面的原因:一是让客户做差异化设计,在单核上做差异化,利用IP核构建NNA,而不是把第三方的GPU整合在一起。在竞争激烈的市场,差异化是非常重要的,我们客户可以用他们喜欢的内核构建SoC。二是现在神经网络发展渐入佳境,PowerVR过去几年进入了该市场,也有些新的技术、新的神经网络、新的框架不断进入该市场。可编程的扩展性可以让客户面向未来设计SoC,可以构建一个Open CL的内核,允许将来把现在还不知道的东西结合在一起,这是非常好的架构设计,和这个行业的发展趋势是密切相关的。


目前,市场上有多种不同架构的神经网络产品,开始进入竞争阶段,对此,Neal Forse表示,每家厂商的起点不同,大家有不同的历史传承,有些竞争对手可能用可编程架构、DSP做神经网络方案,再加上指令级。我们的想法是考虑现在和未来业务的发展方向,我们的做法是通过计算优化的方案实现,通过最优的计算引擎来把神经网络映射到硬件上。所以我们的优化是来自线下的编译,而不是在线的执行。


在客户拓展方面,Imagination副总裁兼中国区总经理刘国军(James Liu)表示,大概有10个客户计划采用我们的NNA,目前正处于评估阶段。这些客户有的做监控、移动手机、物联网,有的应用很有趣,如在健身仪器上可能会用到一些对人体的测试和监控,大部分和图像相关。我们NNA的下一步要延展生态线,特别是汽车电子应用这块,原来的汽车电子大部分是后装的,而今后的发展会有所不同,本地的汽车芯片要进入前装市场,进入车厂的车规里面,因此,我们正在筹划本地汽车电子的生态建设工作,把我们的GPU和NNA放到车规的生态里。


Imagination副总裁兼中国区总经理刘国军(James Liu)


更新三款GPU


除了用于AI的NNA之外,Imagination还推出了其第九代(Series9)GPU系列新品PowerVR 9XEP、9XMP和9XTP。这三款Series9 GPU覆盖了从入门级到高端市场,并结合了效率的改进和新功能。


PowerVR Series9XEP基于Rogue架构,该内核延续了这一类别PowerVR GPU的单位面积填充率优势。具有PVRIC4视觉无损压缩功能,以便确保带宽和内存占用的降低,从而以最低的系统成本为用户提供GUI、人机界面(HMI)和休闲游戏方面的最佳用户体验。其目标系统产品包括机顶盒、数字电视、低成本移动设备、中档汽车仪表盘和车载信息娱乐系统(IVI)。


9XMP计算密度(GFLOPS/mm2)比9XEP显著提高,主要针对中端移动设备、机顶盒和数字电视应用,可提供很好的计算和游戏体验,并为在 GPU上实现人工智能和神经网络处理提供了基础。


9XTP基于Furian架构开发,属于该系列的高端产品,显著提高了游戏/计算密度,并在整体设计上有更全面的功耗/性能/面积(PPA)的优化,使其成为高端移动设备和高端车载信息娱乐系统,以及跨计算/服务器细分市场应用的理想选择。



PowerVR Series9采用了PVRIC4技术,这是Imagination的新一代图像压缩技术,可实现随机访问视觉无损图像压缩,确保了带宽和内存占用率至少节省50%,并使系统能够克服性能带宽限制。与上一代GPU相比,新的GPU系列提供了更强的PPA和时序优化。


PowerVR Series9可以与PowerVR Series3NX神经网络加速器配对使用,利用GPU来管理经典的视觉和预处理算法,并使用Series3NX来实现高度优化的定点神经网络处理。另外,在最近发布的PowerVR汽车技术包中的多项优化可以应用于所有PowerVR Series9内核。



在软件工具方面,Imagination为开发人员提供了免费获得跨平台PowerVR SDK的服务,该SDK可支持3D图形应用开发的所有方面,并提供了可简化3D图形和GPU计算应用开发的工具和实用程序。


用于新GPU的Physical Design Optimisation Kits(DOKs)设计优化工具包括优化的参考设计流程、来自于合作伙伴经过调整优化的逻辑库、特性标定数据和文档,这些灵活的优化工具能优化客户设计的PPA。


帮助客户应对高通和英伟达


目前,市场上做GPU IP的公司并不多,除了Imagination之外,就是高通和Arm了,而高通的业务模式又与Imagination、Arm有所不同,它既向Arm购买IP,也自行研发GPU的IP,主要用于自家的手机处理器SoC。Imagination公司PowerVR图形处理商务运营副总裁Graham Deacon表示,我们在这个行业是做得最好的,我们就是要帮助客户和高通竞争。


在汽车芯片方面,英伟达利用其强大的GPU性能,占据了市场先机。对此,Neal Forse表示,英伟达机器学习做得很好,他们是开源的,我们的模式跟他们不一样,在客户支持方面我们做得更好。关于机器学习,我们的相关技术和产品公开发布情况还未确定。总体来讲,英伟达强在机器学习上,我们强在推算能力上。


Imagination公司PowerVR产品管理和技术营销高级总监Kristof Beets补充说:“英伟达是一家很成功的GPU公司,在汽车行业他们做的都是高端应用,但是往中低端走的并不顺利,特别是在芯片的面积和功耗方面,降下来比较难。我们一直在跟德州仪器和瑞萨合作,可以提供比较全的方案,从低端、中端到高端,有不同的填充率,在GPU方面和英伟达差不多,加上我们的神经网络加速器,我们的解决方案可以覆盖得更全面。”


推荐阅读

史海拾趣

乔光电子(FTR)公司的发展小趣事

Futaba Electric Co., Ltd. 的五个发展故事

故事一:从真空管到VFD的转型

Futaba Electric Co., Ltd.(原名双叶电子)成立于1948年,最初以生产收音机收讯真空管起家。然而,随着技术的飞速发展和市场需求的变迁,公司在1970年做出了关键的战略调整,决定放弃真空管业务,转而专注于萤光表示管(VFD)的研发与生产。这一决定极具前瞻性,因为VFD以其高清晰度、广视角和出色亮度等独特优势,迅速赢得了市场的青睐。Futaba凭借在VFD领域的持续创新和卓越品质,逐渐确立了其在全球市场的领先地位,市场份额超过60%,成为行业内的佼佼者。

故事二:无线电控制技术的突破

进入1960年代,Futaba在电子领域不断拓宽其技术边界。1962年,公司推出了无线电控制设备和冲压金属模用部件,旨在提升工业生产的品质和效率。这一创新不仅解决了工业控制领域中长期存在的供应商品质和交货期问题,还引领了模具制造行业的标准提升。Futaba的无线电控制技术逐渐在模具制造、工业自动化等领域得到广泛应用,为公司后续在无线遥控领域的深入发展奠定了坚实基础。

故事三:无线遥控技术的领导者

随着技术的不断积累和市场的日益扩大,Futaba在无线遥控领域取得了显著成就。特别是在1990年,公司成功研发出高频无线展频通讯技术,该技术以其高可靠性和抗干扰性,在卫星通讯、工业用机器人和工业控制设备等领域展现出巨大潜力。Futaba的无线遥控产品如遥控飞机、车、船等,在休闲娱乐市场也广受欢迎,进一步巩固了公司在无线遥控技术领域的领先地位。

故事四:VFD在汽车行业的广泛应用

Futaba的VFD产品凭借其卓越的性能和稳定的品质,赢得了众多汽车制造商的信赖。自1983年Futaba的VFD产品被福特汽车公司采用以来,其在美国三大汽车厂的市场占有率迅速攀升至100%。这一成就不仅证明了Futaba产品在汽车行业的广泛应用和市场认可度,也为其在高端消费性电子设备市场的进一步拓展提供了有力支持。

故事五:中国市场的深入布局

为了更好地服务于中国市场,Futaba成立了双叶电子科技开发(北京)有限公司,专营日本双叶(Futaba)的全线产品。这家公司在北京设立,不仅负责Futaba真空荧光显示管及模组、RC遥控器等产品的生产和销售,还积极开拓中国市场,参与行业交流和合作。双叶电子科技开发(北京)有限公司的成立,标志着Futaba在全球化战略中对中国市场的高度重视和深入布局。通过不断提升产品质量和服务水平,Futaba在中国市场也取得了显著成绩,为公司的持续发展注入了新的动力。

Herotek Inc公司的发展小趣事

为了更好地服务中国及亚太地区的电子产业集群,Henkel在东莞市投建了汉高电子粘合剂华南应用技术中心。该中心不仅具备先进的研发设备和测试能力,还拥有一支专业的技术团队。通过模拟仿真和数字化手段,该中心能够快速响应客户需求,提供定制化的粘合剂解决方案。自启用以来,该中心已帮助众多电子企业实现了技术创新和产品升级。

Aavid Thermalloy公司的发展小趣事

在消费电子领域,Henkel的粘合剂技术同样发挥着重要作用。随着智能手机、平板电脑等终端设备的不断迭代升级,对结构粘接、散热等方面的要求也越来越高。Henkel针对这些需求,提供了定制化的粘合剂解决方案。例如,其导热凝胶和导热垫片产品能够有效提升设备的散热性能,确保设备在高强度使用下依然保持稳定的性能。此外,Henkel还针对全面屏、折叠屏等新型屏幕技术,推出了专门的聚氨酯热熔胶解决方案,帮助手机厂商提高屏占比和用户体验。

GE Oil & Gas Digital Solutions公司的发展小趣事
检查电源是否正常供电,检查各元件是否连接正确无误,特别是555定时器的引脚连接是否正确。
Advanced Components Industries Inc公司的发展小趣事

在快速发展的过程中,ACI始终注重品质管理。公司建立了严格的质量检测体系,确保每一件产品都符合高标准的质量要求。同时,ACI还积极推行持续改进的理念,不断优化生产流程,提高生产效率。

这些努力使得ACI的产品在市场上赢得了良好的口碑。客户对公司的产品和服务给予了高度评价,纷纷表示愿意与ACI建立长期合作关系。这些正面的反馈进一步推动了ACI的发展。

无锡友达公司的发展小趣事

随着产品性能的不断提升和市场需求的扩大,无锡友达开始积极拓展国内外市场。公司的产品不仅覆盖国内二十多个省、市,还远销欧美、中东、港澳台等国家和地区。通过与国际知名企业的合作,无锡友达不断提升自身的品牌影响力,逐渐在全球电子行业中占据一席之地。

问答坊 | AI 解惑

SD街头快打音乐用AVR单片机播放

SD街头快打音乐用AVR单片机播放…

查看全部问答>

请教一个有关反相时钟驱动路径的约束

电路中用相位相反的时钟去触发相邻触发器。 如果有一个触发器FF1的输出经过组合逻辑电路后与触发器FF2的输入, 除了输出延时外,请问还要如何进行约束? …

查看全部问答>

半天时间搞懂模拟电路

模拟电路精简教程。四十余页包含了模拟电路几乎所有重要知识点,讲解精细,透彻。不敢私藏,传上来与众共享。…

查看全部问答>

测试流接口驱动的测试程序如何写啊?

怎么写测试流接口驱动的测试程序啊?就是在应用程序中如果调用流接口驱动的那几个接口函数啊? 呵呵 有个简单的例子更好。。…

查看全部问答>

启动程序与引导程序有什么区别呀????

启动程序与引导程序有什么区别呀????…

查看全部问答>

求救!有关WinCE6.0 R2 NandFlash驱动的新架构MDD+PDD+FMD的问题

现在NANDFlash驱动的新架构MDD+PDD+FMD已经抛弃了旧的分区驱动mspart和MBR格式,采用region+partition的概念,整个nandflash分为多个region,每个region又可分为多个partition,每个region的开头有一个分区表。 有哪位达人知道这个分区表的格式? ...…

查看全部问答>

指令在哪?

我想开始一个I/O 程序,如何开始?指令及汇编的资料找不到,用C也不知如何开始  …

查看全部问答>

STM32F100C系列如何在不使用JTAG和SWD的情况下烧写程序?

STM32F100C系列如何在不使用JTAG和SWD的情况下烧写程序? 我是新手,请多多指教!…

查看全部问答>

如何学习松翰单片机

有没有成套的松翰开发板买。像51一样方便编译的。 如果没有,请问我要买什么硬件。请列出来 还有,那个松翰仿真器,是不是有接口来连接硬件使用的。就是不用芯片,直接可以接到硬件上使用。 谢谢了…

查看全部问答>

参与HELPER2416开发板助学计划-----(1)晒晒板子

本帖最后由 cf0609 于 2014-7-18 22:55 编辑 前两天就收到板子了,因一些事情耽搁了一下,不好意思哈,现在才来发帖。今天先来晒晒板子的靓照吧。先来个全家福:板子的配件很齐全,除了jlink所有会用到的东西都有。 给板子上电看看,,,开机就 ...…

查看全部问答>