历史上的今天
返回首页

历史上的今天

今天是:2025年06月11日(星期三)

正在发生

2019年06月11日 | FPGA灵活性与ASIC性能 Achronix Speedster7t一个都不能少

2019-06-11 来源:e-works数字化企业网

近年来人工智能技术发展迅速,在金融、交通、制造、安保等众多领域的应用已经让人们见识到人工智能社会到来可能带来的巨大变革。世界各国也高度重视人工智能发展,纷纷出台相关战略和政策,并加大研发投入。根据中国电子学会统计,2018年全年,全球人工智能核心产业市场规模超过555.7亿美元,相较于2017年同比增长50.2%。目前中国人工智能行业的企业总数达到670家,占全球的11.2%。

面对人工智能市场持续升温,人们对于这些系统应如何建构仍十分分歧。随着人工智能与机器学习的应用场景快速发展演进,新的解决方案都要去应对在高性能、灵活和上市时间等方面的不同需求。根据市场调研公司Semico Research的预测,人工智能应用中FPGA的市场规模将在未来4年内增长3倍,达到52亿美元。

在这种趋势下,日前Achronix半导体公司在北京召开了新品发布会宣布推出了全新的Speedster7t FPGA系列产品,以满足人工智能/机器学习(AI/ML)和高带宽数据加速应用日益增长的需求。在Achronix 总裁兼首席执行官Robert Blake看来:AI/ML的应用场景快速发展演进,对芯片的算力、安全性等提出更高要求。Speedster7t是灵活的FPGA技术与ASIC核心效率的融合,从而提供了一个全新的‘FPGA+’芯片品类,它们可以将高性能技术的极限大大提升。

图 Achronix总裁兼首席执行官Robert Blake

专为机器学习和高带宽网络应用打造的Speedster7t

说起Achronix这个名字,也许业界人士还感到陌生,其实Achronix历来都是高性能FPGA市场向前发展的推动者之一。Robert介绍Achronix半导体公司是一家私有的、采用无晶圆厂模式的半导体公司,总部位于美国加利福尼亚州圣克拉拉市,同时提供高性能FPGA和嵌入式FPGA(EFPGA)解决方案。目前,Achronix提供的产品包括可编程的FPGA结构、具有硬连线系统级模块的分立式高性能和高密度FPGA、数据中心和HPC硬件加速器板,以及支持所有Achronix产品的一流EDA软件。

由于通常情况下,相对于ASIC而言,FPGA有上市时间和成本上的优势。另外,在很多环境下FPGA执行某些功能较CPU更高效。这就是为什么它不但运用在数据中心的服务器、交换器、存储层的各个角落,并且具有加速整个工作流程的功能。随着人工智能/机器学习的应用场景快速发展演进,低功率、高吞吐量及低延迟则是AI系统的通用需求。然而很多情况下,增加系统的处理速度势必代表着更多的投入和成本的攀升,两者很难同时满足。

正是看到这种发展趋势,Achronix推出了突破性的Speedster7t FPGA系列产品,该系列产品对高带宽数据加速应用提供ASIC级性能,并具有FPGA的灵活性。

Robert在会上强调Speedster7t FPGA系列产品是专为高带宽应用进行设计,具有一个革命性的全新二维片上网络(2D NoC),以及一个高密度全新机器学习处理器(MLP)模块阵列。通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA +”技术。

“Speedster7t是Achronix历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀,以及与我们领先客户之间的密切合作。”Robert表示在开发Speedster7t系列FPGA的产品过程中,Achronix的工程团队完全重新构想了整个FPGA架构,以平衡片上处理、互连和外部输入输出接口(I / O),以实现数据密集型应用吞吐量的最大化,这些应用场景可见于那些基于边缘和基于服务器的AI / ML应用、网络处理和存储。

五大能力奠定Speedster7t独特优势

Robert介绍Speedster7t器件采用了TSMC的7nm FinFET工艺制造,是专为接收来自多个高速来源的大量数据而设计,同时还需要将那些数据分发到可编程片上算法性和处理性单元中,然后以尽可能低的延迟来提供那些结果。Speedster7t系列产品包括高带宽GDDR6接口、400G以太网端口和PCI Express Gen5等接口,所有这一切单元都互相连接以提供ASIC级带宽,同时保留FPGA的完全可编程性。此外,它还包括以下特点:

1、为计算性能进行了高度的优化

Speedster7t FPGA的核心是其全新机器学习处理器(MLP)中大规模的可编程计算单元平行阵列,它们可提供业界最高的、基于FPGA的计算密度。MLP是高度可配置的、计算密集型的单元模块,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。

MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750 MHz的最高性能将数据传送到MLP。这种高密度计算和高性能数据传输的结合使得处理器逻辑阵列能够提供基于FPGA的最高可用计算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。

2、世界级的带宽

高性能计算和机器学习系统的关键之处是高片外存储器带宽,从而为多个数据流提供存储源和缓冲。 Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。每个GDDR6存储控制器都能够支持512 Gbps的带宽,Speedster7t器件中有多达8个GDDR6控制器,可以支持4 Tbps的GDDR6累加带宽,并且以很小的成本就可提供与基于HBM的FPGA等效存储带宽。

除了这种非凡的存储带宽,Speedster7t器件还包括业界最高性能的接口端口,以支持极高带宽的数据流。Speedster7t器件拥有多达72个业界最高性能的SerDes,可以达到1到112 Gbps的速度。还有带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,以及每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。

3、超高效率的数据移动

来自Speedster7t高速I / O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量,而Speedster7t架构包含一个可横跨和垂直跨越FPGA逻辑阵列的创新性的、高带宽的二维片上网络(NOC),它们连接到所有FPGA的高速数据和存储器接口。它们就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,Speedster7t的NoC支持片上处理引擎之间所需的高带宽通信。NoC中的每一行或每一列都可作为两个256位实现,单向的、行业标准的AXI通道,工作频率为2Ghz,同时可为每个方向提供512 Gbps的数据流量。

通过在Speedster中实现专用二维 NoC,极大地简化了高速数据移动,并确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。最重要的是,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。

4、针对安全性至上和硬件确保应用的安全防护功能

Speedster7t FPGA系列产品在面临第三方攻击的威胁时,可用最先进的比特流安全保护功能应对,它们具有的多层防御能力可保护比特流的保密性和完整性。密钥是基于防篡改物理不可克隆技术(PUF)进行加密,比特流由256位的AES-GCM加密算法进行加密和验证。为了防止来自旁侧信道的攻击,比特流被分段,每个数据段使用单独导出的密钥,且解密硬件采用差分功率分析(DPA)计数器措施。 此外,2048位RSA公钥认证协议被用来激活解密和认证硬件。用户可以确信的是当他们加载其安全比特流时,它是预期的配置,这是因为它已通过RSA公钥、AES-GCM私钥和CRC校验进行了身份验证。

5、经验证的、可向低成本ASIC转换的途径,用以满足大批量需求

Achronix是唯一一家既提供独立FPGA芯片又提供Speedcore嵌入式FPGA(eFPGA)半导体知识产权(IP)的公司。Achronix在Speedcore eFPGA IP中采用了与Speedster7t FPGA中使用的同一种技术,可支持从Speedster7t FPGA到ASIC的无缝转换。FPGA应用通常具有必须保持可编程性的功能,而其他固定功能则是专用于特定的系统应用。对于ASIC的转换而言,固定功能可以被固化进ASIC结构中,从而减小芯片面积、成本和功耗。当使用Speedcore eFPGA IP将Speedster7t FPGA转换为ASIC时,客户有望节省高达50%的功耗并降低90%的成本。

持续创新推动高性能FPGA市场向前发展

Achronix长期以来在可编程逻辑领域总是不断创新,为业界树立了领先性能、功耗和成本的标准。早在2013年,随着其Speedster22i FPGA产品系列开始量产,Achronix提供了业界最先进的、带有面向高性能有线通信应用的嵌入式系统级IP的FPGA产品。Speedster22i系列是第一款专用的FPGA,可支持全新的、创新的和高性能的可编程设计。

2016年10月,Achronix宣布其Speedcore 嵌入式FPGA(eFPGA) IP产品实现量产供应,实现了客户在自己的SoC中对可编程逻辑的集成。在发布之时,Achronix已经向多家客户付运了Speedcore IP产品;自那时起,出现了对Speedcore IP产品的前所未有的需求。Speedcore IP是专为计算和网络加速应用而设计的。

本次Achronix推出了突破性的Speedster7t FPGA系列产品,让FPGA的小尺寸、低功耗以及高灵活性等特点契合人工智能/机器学习(AI /ML)和高带宽应用。未来,全球人工智能市场仍将持续高速增长,“Achronix将继续发挥自身在FPGA领域的技术优势及专业服务能力,满足用户对于产品灵活性、低成本、高性能方面的需求。”Robert总结道。

推荐阅读

史海拾趣

H&D Wireless公司的发展小趣事

随着全球化进程的加速,高创也开始了其全球化布局的步伐。除了在以色列和中国设立研发中心外,高创还积极拓展国际市场,与全球多个国家和地区的客户建立了长期合作关系。通过参加国际知名展会如汉诺威工业博览会等,高创不仅展示了其最新技术和产品,还加强了与国际同行的交流与合作,进一步提升了其国际知名度和影响力。

Ametek公司的发展小趣事

随着全球化进程的加速,高创也开始了其全球化布局的步伐。除了在以色列和中国设立研发中心外,高创还积极拓展国际市场,与全球多个国家和地区的客户建立了长期合作关系。通过参加国际知名展会如汉诺威工业博览会等,高创不仅展示了其最新技术和产品,还加强了与国际同行的交流与合作,进一步提升了其国际知名度和影响力。

启攀微(CHIPHOM)公司的发展小趣事

随着LED背光驱动芯片的成功推出,启攀微电子(CHIPHOM)逐渐在市场上崭露头角。然而,公司并没有满足于现状,而是继续加大研发投入,拓展产品线。在一次国际电子展上,公司展示了音频功率放大芯片和电阻式触摸屏控制芯片,引起了众多客户的关注。通过不懈的市场推广和技术支持,启攀微电子(CHIPHOM)成功打开了国内外市场的大门,实现了销售收入的快速增长。

比亚迪(BYD)公司的发展小趣事

近年来,比亚迪在电子行业的发展进入了新的阶段。为了巩固和扩大国内市场的发展优势,同时加速海外布局,比亚迪开始实施多品牌策略。通过推出不同定位、不同价格区间的产品系列,比亚迪满足了更多消费者的需求。同时,比亚迪还积极推进本地化生产进程,在海外设立生产基地,提高生产效率和降低成本。这些举措不仅提升了比亚迪在全球市场的竞争力,也为其未来的可持续发展奠定了坚实基础。

这些故事展示了比亚迪在电子行业中的发展历程和关键节点,从电池技术的突破、进军海外市场、新能源汽车转型、品牌形象更新到多品牌策略的实施,都体现了比亚迪不断创新、追求卓越的精神。

星海公司的发展小趣事

星海钢琴集团有限公司的起点可以追溯到1949年成立的北京钢琴厂。在那个特殊的年代,陈艾生等红军战士为实现张贞黻的遗愿,即“北平解放后,一定要办起我们自己的乐器厂”,他们四处奔走,多方求助,最终成功创办了星海钢琴厂。从最初的手工制作到现代化生产线的建立,星海钢琴不断传承和发展,成为中国乃至世界知名的钢琴品牌。

Gowanda Electronics公司的发展小趣事

随着国内市场的饱和,星海公司开始实施国际化战略,积极拓展海外市场。公司积极参加国际展览和比赛,展示星海钢琴的品质和实力。同时,星海公司还与国际知名音乐院校和乐团建立合作关系,推动星海钢琴在国际市场的知名度和影响力。目前,星海钢琴已出口到世界60多个国家和地区,成为国际市场上备受瞩目的中国品牌。

问答坊 | AI 解惑

请大家推荐符合要求的单片机

要求如下: 有两个串口 有大的flash (类似于P89C669有96k的flash)。…

查看全部问答>

Wince 应用程序不能截获VK_MENU按键

C/C++ code //Send.exe     keybd_event(VK_MENU, 0x0, KEYEVENTF_SILENT, 0);     keybd_event(VK_MENU, 0x0, KEYEVENTF_SILENT | KEYEVENTF_KEYUP, 0); //Rev.exe BOOL CRev::PreTranslateMessage(MSG* pMsg) {   &n ...…

查看全部问答>

SHNotificationAdd在WINCE 5.0 .net下不弹出气泡通知

如下代码在windows mobile手机上是可以弹出气泡的,但是在wince 5.0开发板上弹不出来.根据MSDN似乎应该是可以的。 SHNP_INFORM Notification bubble displays for the set duration, then disappears. Note For Windows Mobile, this enum ...…

查看全部问答>

懂VB的近来帮下忙

本人用VS2005 编译了一个串口通讯的小软件  用VB写的  为什么当串口一收到数据的时候就弹出以下错误 错误 Temper11.exe NotSupportedException Control.Invoke 必须用于与在独立线程上创建的控件交互。 位于 Microsoft.A ...…

查看全部问答>

SM501不能工作!

CPU:S3C2440 调试环境:H-JTAG+ADS1.2 问题:读出501ID号不对 详述:501作为2440的图像显示模块,与2440连接方式为非 UMA方式,MMIO_BASE=0x2000_0000+0x03E0_0000,501上电 后MMIO_BASE+0x000060寄存器中初始化为0x0501xxa0,但 目前读出的数据 ...…

查看全部问答>

半导体公司招聘(北京) S/W Engineer

1. S/W Engineer (Codec) 1) 4+ years working experience of video, audio codec development 2) Candidates should have strong knowledge and hands-on experience on MPEG-2/4, H.264, AAC/AAC+ algorithm 3) C/C++ and Verilog HDL program ...…

查看全部问答>

ISE初学问题求助?

ERROR: The Top module has not been specified. This can happen if no sources have been added to the project, 是什么意思?…

查看全部问答>

有人用过MSP4250吗?

这芯片怎么回事,我使用了SD16A的第一、二、三通道(AIN0、AIN1、AIN2),每五通道(AIN4)与TIMERA的PWM(TA1、TA2)是同一个引脚。我使用了PWM输出。在使用中发现,只要我打开SD16A的第三通道,TA1引脚输出就一直为低电平,不受PWM控制,当我关掉 ...…

查看全部问答>

这是真正的LaunchPad 材料。

有安装软件、有例子、有GRCC使用等等!…

查看全部问答>

求教VxWorks 的DOSFS 在SD卡上的构建

我在SD卡上构建dosfs文件系统是总是出错: 代码如下 #include \"copyright_wrs.h\"#include \"vxWorks.h\"#include \"taskLib.h\"#include \"blkIo.h\"#include \"stdlib.h\"#include \"stdio.h\"#include \"string.h\"#include \"dosFsLib.h\"#i ...…

查看全部问答>