历史上的今天
今天是:2025年06月25日(星期三)
2018年06月25日 | 被华登和英特尔看上,IC界大牛黄啓弘为您解答这家IP公司
2018-06-25 来源:EEWORLD
2017年七月,在IC领域有着多年经验,先后在IBM、SMSC、arm、Tensilica、Cadence等多家知名半导体公司工作的IC老将黄啓弘加盟NetSpeed Systems(以下简称NetSpeed),担任大中华区销售总监。时隔近一年,NetSpeed 在中国的进展飞速,与寒武纪、地平线和百度都达成了合作意向。
2018年6月,寒武纪宣布获得NetSpeed互联IP授权,以开发下一代AI SoC芯片。寒武纪CTO陈天石表示:“NetSpeed在AI市场高性能互连解决方案方面是无可争议的领导者。我们选择NetSpeed的原因是其IP具备强大的可扩展性,同时可以以最小的代价为AI应用程序提供复杂拓扑的高性能灵活配置能力。”
“我们有一个AI客户,在设计芯片初期只找了三家IP供应商,包括我们,Foundry和Synopsys,因为他们意识到目前芯片设计首先最需要解决的就是数据流问题,不解决数据传输问题就无法进行大规模IP的部署。”黄啓弘在NetSpeed Systems举办的2018年发布会时表示。
“NetSpeed是下一代SoC技术的核心,不论是正在为缓存一致性解决方案竭尽全力的硬件架构师,还是试图用高性能、高效率互联技术打破性能瓶颈的SoC设计时,抑或是为构建高弹性、高容错性系统而百转千回的安全产品经理,都能在NetSpeed找到最佳的解决方案。”黄啓弘介绍道。

NetSpeed System大中华区销售总监 黄啓弘
NetSpeed有多火?
黄啓弘表示,NetSpeed之所以吸引他,一共有两大方面,一个是管理团队,一个是从事的领域,能否在合适的时间合适的方向推出合适的解决方案。
那我们就先分别了解一下:

NetSpeed的管理团队,在网络通信、芯片、EDA及IT系统公司都有着极为丰富的经验。
NetSpeed背后的投资团队呢?


包括华登、Intel资本、SK Hynix、S-Cubed以及Imagination等公司资本投资,同时也有包括陈立武在内的多个个人投资者,可以说是获得业内最顶级最专业的投资机构认可。
而在客户方面,同样是业界最为领先的客户群体,如图所示:

这其中不光有芯片公司,还有电信公司、移动公司以及汽车电子公司,NetSpeed的产品已广泛应用于数据中心、存储、网络、移动、数字家庭以及汽车电子中,得到业界的广泛认可。
目前NetSpeed已有多款产品线,包括Orion、Gemini、Pegasus以及最新推出的Orion AI。同时,黄啓弘也透露,针对部分厂商,比如Intel、高通等,公司也会根据需求进行定制化的产品。
Orion AI解决AI芯片总线和带宽的瓶颈
从产品命名上就可以看出,Orion AI是专为AI应用而生的产品。
黄啓弘表示,目前AI芯片设计存在着不小的挑战,为了解决大量矩阵算法的需求,AI芯片架构往往需要采用多核并行计算,这种拓扑结构带来了大量的点对点通信,为了提高性能和实时性等问题,就需要在带宽和延迟方面有着更高要求。与此同时,为了节约能耗,内核或总线需要支持休眠模式,对于复杂的总线系统来说,功耗问题同样不容小觑。
黄啓弘介绍道,Orion AI是业界最早也是唯一一个支持基于广播推送的可配置多播网络IP,采用分层堆叠架构解耦架构,每层均可扩展或收缩,可以以具备端到端QoS规划的非阻塞路径来控制带宽与延迟。
在具体性能表现上,Orion AI支持最高1024位总线,,频率达2GHz,最多支持1000个内核,可实现TB/s级别的吞吐量。同时,采用了现今的低功耗管理技术以提升能效。而通过先进的人工智能算法,可提供在解决方案空间中搜寻最有效的解决方案。
Orion AI是如何加速AI芯片设计的?
黄啓弘表示,借助Orion AI,用户可以快速实现芯片设计。“采用我们的产品之后,即便是特斯拉的汽车自动驾驶芯片,也只需要九个月的开发周期,相比平均18个月的芯片开发周期来说大大缩短。”黄啓弘说道,“尽管Orion AI方案的芯片面积开销只需要3%-5%,但是客户同时得到的便利性是无与伦比的。”
黄啓弘用通俗的计算机网络通信架构解释了Orion AI的魔力:“以前芯片拓扑架构就是个大的蜘蛛网,但是在下一代AI芯片架构中,由于内核众多,总线布局变得极为复杂。所以NetSpeed采用了全新的类通信架构,如果把每一个内核IP/Host看做是一个网络终端,需要传输的数据利用Bridge路由传输,自动实现多播,而如果仅依靠以往的总线布局实现多核多播将会变得异常复杂。另外,Orion AI采用具有专利的QoS规则,支持分阻塞路径与带宽分配的虚拟化信道。而无需回应的多播,则可确保神经网络每层矩阵计算间通信实现最小延迟,从而优化处理效率。”
黄啓弘强调,所有一切都是利用人工智能算法自动完成迭代,只需要1-2分钟就能给出最优的RTL结果,同时也支持手动调节,并且给出相应的参数,让工程师可以方便判断。
“如果核太多,那么利用人工布局布线就会变得很难,即使做出来,频率、延迟等特性还是没法做到最优,而通过人工智能的办法,什么时候加流水,什么时候加bridge,都可以给出最优化的解决方案。”黄啓弘说道。
“为什么我们能加速芯片开发周期,最主要原因就是很多前端RTL交给后端P&R时,发现摆不开,或者是延迟太厉害,布线太拥塞,如果回过头来改Spec,Marketing又不一定同意,这其中需要牵扯太多的精力,如果从架构设计初期就可以考虑后端,那么整个设计流程自然会缩短。”黄啓弘解释道。
所以,NetSpeed不只是一套简单的总线IP供应商,更是提供了一种创新的架构设计方法。
目前,NetSpeed已经通过了ISO 26262认证,符合ASIL-D安全标准,这也是目前市场上唯一一家在互联IP领域获得认证的公司。
地平线创始人及CEO余凯表示:“我们的芯片技术需要灵活和可扩展性以适应广泛的功率、性能和面积要求。NetSpeed的互连IP使我们能够快速调整我们的平台,以满足各种嵌入式AI应用的特定要求。我们选择NetSpeed的技术是因为他具有更高的性能,高度一致性、可配置性和可扩展性。我们相信NetSpeed的IP是优秀的片上网络解决方案,完全满足下一代面向AI应用的SoC需求。”
NetSpeed在中国
黄啓弘表示,目前中国团队有五名员工,负责支持与销售工作。“中国目前在国家政策和市场推动的双重利好下,诞生了大量的AI公司,这也是我们为什么要加强中国市场的建设。我相信未来几年,NetSpeed在中国的发展将会是飞跃式的。”黄啓弘说道。
为了满足中国市场的需求,NetSpeed在中国进行了大量定制化工作,包括直接提供IP给中国公司,无需加密和连接到云端,让客户可以更简单容易的实现。同时也在授权上更加灵活,让中小型公司也可以进行评估工作。
“AI最早起源于算法,但是这些AI公司无论是和芯片公司合作,还是放到FPGA中都不是长久之计,为了实现最佳的性价比,必须要生产自己的AI芯片。通过采用我们的方案,可以加速产品的开发周期,并且可确保未来架构可扩展,以支持不断演进的软件环境。”黄啓弘总结道。
史海拾趣
|
无线监控在一些特殊领域中,如偏远山区、水电站等区域,发挥着越来越重要的作用。而3G的兴起,也为无线监控带来新的发展。 随着第三代移动通信技术(3G)商业化应用规模的不断拓展,三大运营商纷纷基于3G高速无线接入的特性,发展多 ...… 查看全部问答> |
|
尊敬的各位师傅们,我是个菜鸟想学习图形开发,但不知道它在计算机中的工作原理,不明白屏幕上显示的字符和图形和显存,内存的关系,希望大家帮帮我!非常感谢!!!最好能 GDI函数和内存显存的关系?GDI函数是运行在内存还是显存? 穿透色和透明区别??? 那裁剪区域可以作用于画布和图层吗? 显存和屏幕缓冲的区别是什么?都是在显卡里吗?还是说显示器上还有缓冲吗? 显存和屏幕缓冲与图层和画布的关系是什 ...… 查看全部问答> |
|
下面是nboot loader.h中的一段定义: // NAND Boot (loads into SteppingStone) @ Block 0 #define NBOOT_BLOCK 0 #define NBOOT_BLOCK_SIZE ...… 查看全部问答> |
|
wince下的线程方法(c#)没有像pc上那么方便的挂起,重启功能,要让线程挂起一段时间在从挂起的地方开始有没有什么好办法呢目前我是采用成员变量来控制的 while (pause){},给定一个循环让他不停转直到外部判断跳出循环,总觉得这样做很不可靠而且c# ...… 查看全部问答> |
|
我的max264滤波器设置如下:采用模式3,外部时钟2M,分频后1M,中心频率10kHz 品质因数:0.5871;在调试时输入的信号却从10Hz到100KHz均可通过,但是输出的波形已经失真,输入波形为正弦波,输出时,在频率比较低时输出的是被削去一点波峰的 ...… 查看全部问答> |
|
Xilinx提供这种机会对于我们电子电气类学生来说,堪称天赐良机。倘若能够有幸适用样板,一定认真学习Xilinx FPGA,巩固自己的同时,和同学老师广泛交流,对比Xilinx与Altera在设计及性能上在不同,也希望在此过程中学习感受Xilinx公司文化,将来如 ...… 查看全部问答> |
|
网络指示灯快闪。模块应该正常启动了。通过RS232跟电脑通迅正常。能收发一些跟SIM卡无关的数据。供电也平稳,我用示波器看过了。资料里说模块复位后SIM卡部分所有引脚输出低电平。是不是要输入什么指令啊… 查看全部问答> |
|
MSP430在Flash中开辟一块区域用来存数据是怎么操作的? RT 现在都不确定程序写完有多大,flash哪些部分被占用也不清楚。 如何能够确定一块连续区域能够用来存数据? information memory segment abcd太小,完全不够用。… 查看全部问答> |




