历史上的今天
返回首页

历史上的今天

今天是:2024年12月15日(星期日)

2021年12月15日 | OPPO推出NPU,迎接计算影像时代——情理之中与意料之外

2021-12-15 来源:EEWORLD

从媒体爆料OPPO造芯,到今天OPPO正式发布首款自研芯片,至今已过去接近两年。

 

日前在OPPO INNO DAY 2021上,OPPO发布了首个代号为MariSilicon X的影像专用6nm NPU,算是对两年造芯历程的一个小总结。


image.png?imageView2/2/w/550

 

根据官方信息描述,MariSilicon X具有极致功耗比、行业领先的HDR、针对RAW的20bit快速计算以及支持定制的RGBW Sensor优化四大方面特色。

 

看到这则新闻后,不知道您是什么感觉。对于我来说,起初会觉得在情理之中,毕竟截至目前,几大手机商都已或多或少推出了自行开发的芯片。

 

但是通过介绍参数的性能,又使我感到震惊,全球范围内推出EUV 6nm制程NPU的企业并不算多,况且这还是OPPO第一个量产芯片。就在OPPO公布一系列详细的芯片指标之后,让我回忆起了2017年,那一年,海思首款集成NPU的10nm SoC麒麟970问世,拉开了AI在移动平台上的帷幕。而现在即将迎来的,是移动平台计算的下一波浪潮——AI计算影像。


手机厂商自研芯片是情理之中 


近年来,无论是苹果、谷歌还是华为等手机商,都在自行开发SoC,其中最显著的特性就是增加了NPU,利用AI加速器提升应用性能并降低功耗。以往,计算任务是通用的,大多数任务都依赖于标准 CPU/GPU/VPU或者ISP/DSP等。人工智能(AI)和机器学习 (ML) 的飞跃式发展带来了独特的计算要求,传统的或者说通用的神经网络加速器(CNN)可能无法有效加速个性化的AI 任务,因此业界不仅需要用于处理 AI/ML 工作流的硬件,还需要专门针对特定 ML 模型优化的硬件。这些差异化需求很难依赖英特尔或者高通来快速获取。

 

比如苹果和谷歌的手机中可能都有语音助手,但是他们使用的底层ML模型和架构可能会有很大不同,通用处理器无法优化。这些公司可以针对其特定的软件应用程序和架构微调他们的芯片,从而使算法——软件——硬件三者实现完美的紧耦合。


作为中国前两大智能手机厂商,手握大量图像相关专利的OPPO,自然有推出芯片的动力和能力。

 

时间回到2020年2月,彼时OPPO CEO特别助理发布了一篇名为《对打造核心技术的一些思考》的内部文章,曝光了“三大计划”,分别是涉及芯片业务的“马里亚纳计划”(OPPO此次发布的MariSilicon X就是以此命名 )、涉及软件开发业务的“潘塔纳尔计划”和涉及云服务的“亚马逊计划”。

 

所以从那时起,一切都已在情理之中了。


手机进入计算影像时代


随着影像成为手机重要差异化的特性,被姜波称为是“计算影像探索的第一步”的MariSilicon X诞生就显得那么理所应当了——通过结合了ISP和NPU等功能,OPPO率先进入了计算影像时代。

 

image.png?imageView2/2/w/550

 OPPO芯片产品高级总监 姜波


姜波是OPPO芯片产品高级总监,于2019年到岗。此前,他曾在高通中国担任首个智能手机SoC产品经理,经历了中国智能手机的产业链爆发期。OPPO则是姜波加盟的首家国内企业,而且还是一家终端厂商,这和他过往的芯片公司经历完全不同。

 

也正是在这两年间,通过领导芯片开发团队以及各部门协调过程中,姜波对于OPPO有了更深的了解:“作为一线终端公司,OPPO一切都是从消费者角度出发,MariSilicon X从立项开始,就是从用户场景反推出来的规格要求,这和以前在芯片公司产品开发逻辑完全不同。”

 

“OPPO更多是从解决用户的痛点角度出发进行垂直整合。我们有SoC算法能力、硬件设计能力、传感器及摄像头/光学模组的定制和整合能力。作为手机产业链的最重要一环,OPPO有机会也有能力做到最深度的整合和优化,而且是面向消费者的。”姜波说道。

 

谈及MariSilicon X的诞生原因,姜波表示,OPPO已经具有多年通用SoC平台的CV(计算机视觉)算法、AI算法的积累,但通用SoC想要达成计算影像的终极体验依然存在诸多挑战。“比如定制化的传感器,如果要与通用SoC配合,两者的开发周期不同,很难平衡;另外如果采用商用传感器,要在通用SoC上做优化,研发需要很多调整,成本和上市周期都会增加。只有将算法与芯片、软件与硬件进行紧耦合,才可以完成真正的计算影像。”

 

实际上不光是手机,从云计算到汽车,从IoT到工业,随着AI等技术的兴起,对于算力的需求越来越个性化,数家软硬件公司均不约而同地选择了自研芯片道路。一方面是因为确保供应链稳健,另外更重要的则是通过对核心底层技术的掌握,从而完善产品的差异化。

 

这一切变革,正如英伟达CEO黄仁勋在2017年时的判断:软件会吃掉世界,但AI会吃掉软件。


马里亚纳的意料之外


此前有媒体就表示OPPO的高管接受采访从来不会与“友商”做比较,而是坚持“本分”的企业文化。此次马里亚纳 X的发布,OPPO的确也是不慌不忙,错开了几大友商及SoC供应商的发布日期。

 

但“好饭不怕晚”,相比小米“遮遮掩掩”的澎湃C1、VIVO“背靠大树”的V1,MariSilicon X的发布更为坦率。尽管MariSilicon X的定位并不像高通、联发科新发布的to C端的旗舰SoC芯片,因此并没有公布详细的Die面积、晶体管数量等敏感信息,但姜波还是尽可能地公开了更多的芯片细节。通过这些意料之外的细节,业界有必要对OPPO的首个自研芯片刮目相看。


没有办法的办法——自研多款IP


此次发布,姜波只透露了MariSilicon X中的三个IP,分别是MariNeuro、MariLumi以及MIPI PHY。

 

其中MariNeuro AI计算单元是OPPO自行开发的NPU,姜波也坦言,如今很多IP供应商可以直接提供NPU,但通过评估,“没有一个NPU可以根据OPPO的场景和算法,达到最优的能效比”。

 

image.png?imageView2/2/w/550


MariNeuro的诞生,可以使OPPO具有训练优化的底层能力,从而达到最佳用户拍照体验。并且目前CV/AI算法仍在不断迭代,选择自研NPU便可以更好地掌握主动性。

 

“只有通过影像专用NPU,才能解决目前ISP和通用SoC的算力不足和能效难题,这是未来影像发展的主流方向。”姜波总结道。

 

此外,为了解决内存墙问题,OPPO也专门为MariNeuro开发了片上内存子系统,达到万亿比特/秒(Tb/s)级的传输速率。而除了片上存储之外,MariSilicon X还合封了256Mb的LPDDR4X作为独立DDR带宽,从而提升系统整体的内存吞吐率。

 

MariLumi则是OPPO自研的ISP Pipeline IP。与NPU配合,实现真正的实时计算影像。

 

除了以上两个重要IP之外,OPPO还自研了诸多其他IP,比如MIPI接口等。姜波解释道,自行开发的根源是OPPO采用了RGBW的传感器,需要用到两路RAW Pipeline,因此对MIPI总线的峰值吞吐量有较高要求,而OPPO无法在市场上找到对标的IP,因此只得选择自行开发。

 

姜波强调,所有IP都自行开发显然不现实,OPPO也有选择商用IP的大原则,就是需要满足极致体验,比如上述提到的三款产品,第三方IP无法达到要求,才会自行开发解决。


追求极致化——选择台积电6nm EVU工艺


MariSilicon X采用了台积电6nm工艺,对此姜波也承认,相比6nm而言,12nm的研发周期、IP可获取性以及流片验证会更加友好。但是OPPO通过仿真评估,认为只有6nm可以同时满足性能及功耗上的要求。

 

image.png?imageView2/2/w/550


正是在MariSilicon X立项之前的2019年,台积电宣布推出EUV技术的N6(6nm)制造工艺,与采用DUV的N7(7nm)相比,N6提高了18%的逻辑密度,性能和功耗不变,并且使用相同的设计规则,使得从IP到工具等生态系统可以继续沿用。而根据台积电的近期公告,其计划在 2021 年第四季度用 6nm 取代 48-50% 的 7nm产能,显然直接立项在6nm,可以实现更快的商业化。

 

目前采用最先进制程的芯片企业几乎都是SoC或CPU等,MariSilicon X不计成本地选择了6nm技术,也使其成为手机中仅次于SoC的选择EUV技术的芯片。

 

根据姜波的介绍,目前OPPO拥有完整的芯片开发团队,包括设计、验证、后端集成等。也正是因为全流程都在自己掌控中,使得OPPO首个先进制程的芯片取得了一次流片成功的成绩,并且夸张到“没有任何小的修改或Debug”。

 

整个开发过程非常紧凑,尤其是考虑到OPPO还自研了多款IP的情况下,并没有流片测试验证的时间。况且移动应用有功耗的约束,再加上先进的制程工艺,一次成功离不开团队所有人的经验和努力,甚至还有一点点的运气。在姜波看来,从立项到点亮的整个过程,简直是“走了两年的钢丝”。


MariSilicon X的四大特色解析


有了IP,有了先进的EUV代工,有了全流程的设计人才,那么MariSilicon X究竟实现了那些突破?姜波给出了四个方向。


image.png?imageView2/2/w/550


极致能耗比


借助MariNeuro NPU,MariSilicon X实现了18 TOPS的算力以及11.6 TOPS/W的算力功耗比。18 TOPS的算力相比iPhone的A15增加了20%,但这不是重点。正如姜波所说,手机NPU设计的难点不在算力,而是在效率上。更重要的是能效评估不是执行通用的神经网络算法,而是执行真正应用场景下的算法,只有真实数值才最有参考价值。


对此姜波给出了实际数值,比如在FindX3 Pro中,使用了骁龙888处理器,在运行OPPO AI降噪算法只能实现2 fps的处理速度,这意味着无法支持AI降噪的视频拍摄,并且功耗高达1.7W。而在MariNeuro NPU上,可以在800mW的功耗约束下实现40 fps的4K AI降噪视频拍摄。

 

行业领先的HDR


借助于MariLumi ISP Pipeline IP,实现了20bit带宽、120dB动态范围的图像处理能力,可以实现更好的HDR。就在数天前,高通和联发科陆续宣布了旗舰SoC,都是采用了18bit的ISP,更高的带宽意味着更高的数据吞吐率、更多的色彩信息以及更好的动态范围。


通过简单计算,20-bit的ISP可以实现1,048,576个亮度范围,而18-bit只能实现262,114个。也正是如此,MariLumi可以实现4倍于现有旗舰SoC的动态范围。实测结果也显示,MariSilicon X在4k场景下,亮部是在8dB,暗部为12dB,也就是说图像暗部的信噪比可以实现4倍的有效提升。

 

20bit RAW实时计算


除了此前提到的4倍于现有旗舰SoC的HDR之外,MariSilicon X的强大性能可确保芯片具有实时RAW域的降噪、HDR等处理能力,相比传统SoC基于YUV域的处理,可以更好地保存照片或视频的原始信息,实现真正所见即所得的体验。


与定制RGBW传感器紧耦合


RGBW技术并不是新技术,早期的技术实践简单理解就是将其中一个G(绿光)替换为W(白光),虽然提升了感光度但是由于信号串扰、猜色算法准确性等限制,会出现偏色情况。


不久前OPPO曾与SONY合作,将自研四合一像素聚合等一系列算法直接写入传感器硬件,通过新型的定制化像素排列方案保证猜色精确度和成像质量。如今,借助MariSilicon X,可实现传感器的进一步耦合,从而最大化传感器的能力。正如姜波此前表述,两路的RAW Pipeline其中一路处理RGGB,另外一路则专门负责处理白光通道。通过两路并行处理,使得成像信噪比提升了8.6dB。同时,针对纹理细节处理,Pipeline则通过超采样方式,提升了70%的解析力。


计算影像的未来十年


作为引领未来十年计算影像市场的开山之作,MariSilicon X被寄予了厚望。姜波表示,目前计算影像市场的很多算法还未成熟,因此OPPO才会开发出专用的影像NPU去探索这一市场。毕竟手机受制于外形、尺寸等限制,传感器不能无限增大,如果继续提升影像品质的话,通过提升计算影像的算力是必经之路。


从结果来看,针对视频的实时处理场景,借助MariSilicon X,OPPO可以同时实现4K+20bit RAW+AI+Ultra HDR规格夜景视频,已然打破了手机计算影像算力的新极限。


珠穆朗玛是大家看得见的巅峰,而马里亚纳作为全球最深的海沟,代表的则是隐藏更深的无人区,“马里亚纳计划”亦是如此。


一切为提升用户体验的支撑,都来源于OPPO对无人区的不断探索。


推荐阅读

史海拾趣

Avasem公司的发展小趣事

随着全球对环境保护和可持续发展的关注度不断提升,Avasem公司积极响应这一趋势,将可持续发展理念融入公司的战略规划和日常运营中。公司采用环保材料和工艺生产电子产品,降低生产过程中的能源消耗和废弃物排放。同时,Avasem公司还积极参与社会公益事业,支持教育、环保等领域的项目。这些举措不仅提升了公司的社会形象,还为其赢得了更多消费者的支持和信任。

请注意,以上故事均为虚构内容,旨在展示一个电子行业公司可能的发展路径和策略。在实际情况下,一个公司的成长会受到多种因素的影响,包括市场环境、技术发展趋势、公司战略选择等。因此,这些故事并不能完全代表任何真实存在的电子行业公司的发展历程。

DAESAN公司的发展小趣事

在电子行业的激烈竞争中,DAESAN公司也曾遭遇过困境。一次严重的金融危机让公司的资金链几乎断裂,许多项目被迫中断。然而,DAESAN公司并没有放弃,他们积极寻求外部支持,同时加强内部管理,降低成本,提高效率。在困境中,公司不断总结经验教训,优化经营策略。最终,他们成功度过了危机,实现了逆境中的成长。

Freqtech Ohg公司的发展小趣事

随着全球对环保和可持续发展的重视,Freqtech Ohg公司积极响应,将绿色生产理念融入企业运营的每一个环节。公司引入先进的环保设备和生产工艺,减少生产过程中的能源消耗和废弃物排放。同时,Freqtech还加大了对可再生能源的投资力度,如建设太阳能发电站等,以降低企业运营对环境的影响。这些举措不仅提升了公司的社会形象,还为公司的长期发展奠定了坚实的环保基础。

Gold Peak Group公司的发展小趣事
定期对控制电路进行检查和维护,确保接触器、继电器等元件的性能良好,触点无粘连或损坏。
ANYSOLAR LTD.公司的发展小趣事

随着ANYSOLAR的产品在市场上取得一定的成功,公司开始考虑市场拓展。李明带领团队深入调研国内外市场需求,发现欧洲市场对高效、环保的光伏材料有着巨大的需求。于是,ANYSOLAR开始积极寻求与国际企业的合作机会。

经过多次洽谈和协商,ANYSOLAR最终与一家欧洲知名光伏企业达成了战略合作协议。双方共同投资建立生产线,共同开拓市场。这一合作不仅为ANYSOLAR带来了稳定的订单和资金支持,也提升了公司的品牌知名度和国际影响力。

Corsair Electrical Connectors Inc公司的发展小趣事

随着市场的不断发展,Corsair意识到只有不断创新才能在竞争中立于不败之地。因此,公司加大了对研发的投入,积极引进先进技术和设备,不断提升产品的性能和质量。在一次次的尝试和失败后,Corsair的研发团队终于突破了行业技术瓶颈,成功开发出了一款具有高性能、高稳定性的连接器产品。这一创新成果不仅赢得了客户的青睐,也为公司在行业中树立了良好的口碑。

问答坊 | AI 解惑

从封装技术发展来看半导体设计仅仅是刚“起步”!

当创建一款新型的IC时,开始时关注的焦点很自然是设计。随着亚微米工艺的普及,在进入流片阶段以及随后的验证阶段后,掩模和晶圆制造成本都大幅增加,于是多项目晶圆(MPW)业务目前正在得到普及和增长。然而除非到了最后,人们不会投精力于器件的封 ...…

查看全部问答>

什么是模块电源-----模块电源的设计分析

模块电源,电源模块是可以直接贴装在印刷电路板上的电源供应器 (参看图1),其特点是可为专用集成电路(ASIC)、数字信号处理器 (DSP)、微处理器、存储器、现场可编程门阵列 (FPGA) 及其他数字或模拟负载提供供电。一般来说,这类模块称为负载点 (PO ...…

查看全部问答>

PCB制造工艺流程及工艺要求

ACP HDI板的工艺能力,比较早(2004年)的了,可供参考…

查看全部问答>

第7/15原创:事无巨细,片内ADC

事无巨细,ADC上阵 今天来讲讲AVR单片机的片内ADC的使用方法。比较简单,希望很快完成。 先看看什么是ADC: ADC,英文全称为Analog Digital Converter,即模拟数字转换器,可以将连续的模拟量通过取样转换成离散的数字量。 那什么是模拟量呢: ...…

查看全部问答>

AVR单片机定时器0设置的问题?

IAR的开发环境,用的是Atmega48单片机。 T0中断无法进入!设置如下: void timer0Init()            //定时器0初始化 {   // initialize timer 0   //TCCROB =0X00;    ...…

查看全部问答>

有没有人学嵌入式的啊??

刚开始学的,看书糊里糊涂的,概念乱啊,有点看不下去了, 书是北航的嵌入式系统原理 不知道是不是要换换学嵌入式的方法, 不知道版里的前辈们有什么好的建议啊?谢谢阿…

查看全部问答>

关于嵌入式设备关机的软件处理流程

大家好,我的问题是: 一般嵌入式设备按某个按键关机,软件处理哪些事情(kill掉所有进程,显示关机画面等),硬件上处理哪些事情?(关掉mcu供电?) 谢谢大家…

查看全部问答>

内存地址映射问题,初学者,高手指教。

问:        cpu中的寄存器是以什么方式对应到编程中的一段地址的?知道有统一编址,那么硬件上是怎么实现在应用程序中通过一个地址去访问寄存器的,这个对应过程是怎样的?还有统一编址和独立编址这个内存的地址在编程是对应 ...…

查看全部问答>

请教C语言的基本概念

1、C有哪些数据类型? 2、什么是指向指针的指针? 3、为什么C语言的字符串要用“\\0”结束?…

查看全部问答>