历史上的今天
今天是:2024年10月20日(星期日)
2018年10月20日 | 赛灵思转型新举措,推出Versal ACAP与Alveo加速器卡
2018-10-20
2018年10月16日,赛灵思在北京召开了一年一度的赛灵思开发者大会。
大会开场阶段,赛灵思总裁兼首席执行官Victor Peng开篇并没有介绍自己公司的产品,而是向大家介绍了自己的一个爱好——长跑。
Victor Peng提到,他本人在长跑方面并没有天赋,只是一个偶然的机会参加了一次全马,尽管没有做任何准备,但他依旧坚持跑完全程。在这之后,Victor Peng开始对马拉松上瘾了,他开始制定目标并做为之做出努力,这样一步一步,Victor Peng开始锻炼并积极参与各项马拉松活动,甚至跑完了100公里的超级马拉松。
Victor Peng表示,马拉松可以让人从生理到心里都经历历练与洗礼,而更重要的是,Victor Peng从中吾出了一个道理:如果想把事情做到更好,必须要学会转型同时还要为之付出不懈的努力。
赛灵思总裁兼首席执行官 Victor Peng
本次大会上Victor Peng宣布推出 业界首款自适应计算加速平台 Versal与功能强大的加速器卡Alveo。两款新产品也将成为赛灵思战略转型的重大举措。
一、业界首款ACAP——Versal
首先先来说说什么是ACAP?
为应对标量处理单元(例如 CPU)、矢量处理单元(例如 DSP、GPU)与可编程逻辑(例如 FPGA)存在的一些不足,赛灵思推出了自适应计算加速平台 ——ACAP。ACAP 结合了新一代标量引擎、自适应引擎和智能引擎。NoC 通过存储器映射接口将它们相连,总带宽为 1Tb/s+。除 NoC 之外,可编程逻辑(和集成型 RAM 块)支持的大量存储器带宽支持可编程存储器架构针对单个计算任务进行层级优化(避免了其他基于高速缓存计算单元固有的高时延和时延不确定性)。
ACAP主要有以下三大优势
1、 软件可编程性——能够通过软件抽象工具链快速开发优化应用。
2、 加速——指标涵盖广泛的应用,包括人工智能、智能网络接口卡、高密度存储、5G 无线、自动驾驶汽车、高级模块化雷达,以及太比特光网络。
3、 动态自适应重配置——能够重配置硬件,实现毫秒间加速新的负载。
因为ACAP的出现,未来的计算已经开始了,赛灵思在开发者大会上隆重的推出了历经四年研发的首款Versal ACAP。
据赛灵思官方介绍:Versal 产品组合基于 台积电(TSMC)的 7 纳米 FinFET 工艺技术,是第一个将软件可编程性与特定领域硬件加速和灵活应变能力相结合的平台,这对于跟上当今快速的创新步伐至关重要。该产品组合包括 6 个系列的器件,其独特架构针对云端、网络、无线通信乃至边缘计算和端点等不同市场的众多应用提供了可扩展性和 AI 推断功能。
在赛灵思开发者大会上, Victor Peng宣布推出前两个系列,Versal Prime基础系列与AI Core核心系列。
1、Versal Prime基础系列
据Victor Peng 先生介绍,Versal Prime属于终端系列,其中包括9款产品,每款产品都具备以下特色:
●采用双核 Arm® Cortex-A72 应用处理器、双核 Arm® Cortex-R5 实时处理器、256KB 片上存储器(带 ECC)、超过 4000 个专为低时延高精度浮点运算优化的 DSP 引擎。
●包括 200 多万个系统逻辑单元,结合 200Mb 以上 UltraRAM、超过 90Mb 的块 RAM 以及 30Mb 分布式 RAM,能支持定制存储器架构。
● PCIe® Gen4 8信道和 16 信道以及 CCIX 主机接口、功耗优化型 32Gb 每秒的 SerDes 和主流 58Gb 每秒的 PAM4 SerDes、多达 6 个集成型 DDR4 存储器控制器、多达 4 个多速率以太网 MAC、700 个高性能 I/O(支持 MIPI D-PHY)、NAND、存储级内存接口和 LVDS、78 个多路复用 I/O(连接外部组件)和超过 40 个 HD I/O(3.3V 接口)。
●以上均通过业界一流的片上网络 (NoC) 实现互联,具有多达 28 个主/从端口,以低时延提供每秒多 Tb 带宽,而且提供高功率效率和原生的软件可编程性。
2、Versal AI Core核心系列
Versal AI 核心系列提供该系列最高计算性能和最低时延,实现突破性的 AI 推断吞吐量和性能。该系列针对云端、网络和自动驾驶技术进行了优化,提供业界最广泛的 AI 和工作负载加速功能。Versal AI 核心系列 有 5 款产品,产品特色如下:
●提供 128 到 400 个 AI 引擎。该系列包括双核 Arm® Cortex™-A72 应用处理器、双核 Arm® Cortex™-R5 实时处理器、256KB 片上 ECC 存储器、超过 1900 个专为高精度低时延浮点运算而优化的 DSP 引擎。
● 190 多万个系统逻辑单元以及超过 130Mb 的 UltraRAM、高达 34Mb 的块 RAM 和 28Mb 分布式 RAM 和 32Mb 新加速器 RAM 块,任何引擎都能直接访问,都能支持定制存储器架构。
●该系列还包括 PCIe® Gen4 8 信道和 16 信道以及 CCIX 主机接口、功耗优化型 32G SerDes、多达 4 个集成型 DDR4 存储器控制器、多达 4 个多速率以太网 MAC、650 个高性能 I/O(用于 MIPI D-PHY)、NAND、存储级内存接口和 LVDS、78 个多路复用 I/O(连接外部组件)和超过 40 个 HD I/O(3.3V 接口)。
●以上所有器件均通过业界一流的片上网络 (NoC) 实现互联,具有多达 28 个主/从端口,以低时延提供每秒多 Tb 带宽,而且提供高功率效率和原生软件的可编程性。
除了AI Core核心系列和Versal Prime基础系列产品之外,Versal系列芯片组还包括Versal 旗舰系列(Versal Premium旗舰)系列、 HBM 系列、AI 边缘系列 ( AI Edge) 与 AI 射频系列(AI RF)。
二、功能强大的加速器卡——Alveo
Alveo是行业内第一个灵活多边的加速平台,基于16纳米的工艺。之所以说Alveo与其他加速卡不一样,是因为相比它有着更强大的功能:
1、速度更快。就机器学习而言,Alveo U250实时推断吞吐量比高端 CPU高出20 倍,相对于高端 GPU 等固定功能的加速器,能让 2 毫秒以下的低时延应用性能提升 4 倍以上。此外,Alveo 加速器卡相对于 GPU 能将时延减少 3 倍,在运行实时推断应用时提供显著的性能优势。]数据库搜索等一些应用可从根本上得到加速,性能比 CPU 高90 倍以上。
2、灵活多变。与所有赛灵思技术一样,随着应用的变化能对硬件进行重配置,从而针对工作负载迁移、新标准和更新的算法进行优化。
3、更容易访问。Alveo加速卡更易于使用,可以帮助更多的用户以更快的速度投入使用。
Alveo U200 和 Alveo U250 现已开始接受量产订单。
赛灵思的使命是“打造灵活应变、万物智能的世界”,在过去几年中赛灵思已经取得了很大的进展,但这仅仅是个开始,在未来,赛灵思依旧会致力于帮助广大用户及合作伙伴应对快速创新带来的挑战并取得成功。
史海拾趣
|
1、请问verilog中: 1)4\'h9,4\'d9有什么区别? 2)4\'d1,4\'h1,4\'b1又有什么区别? 我在写程序的过秤中经常遇到熟知的问题二相当的头疼。 依照老师的说法:1)中,4\'h9指的是用四位二进制数表示的16进制数9,4\'d9指的是用四位二进制数表示 ...… 查看全部问答> |
|
wince 5下能否通过USB device实现标准的U盘? 开发的wince 5设备有USB device,现在已经可以通过active sync来和Winxp PC实现同步。 但是感觉这个sync功能太强了,不希望用户能查看所有的wince文件。仅仅需要实现U盘的功能就可以了 就是通过usb device连接PC,用户仅仅看到一个U盘,可以读写 ...… 查看全部问答> |
|
我从网上下载了USBOOT工具和MAXDOS(中文版),在XP系统下制作了USB引导盘(U盘是KingSton),然后去引导VIA 的 EPIA CN(X86架构)班子,在CMOS中已经设定为USB-FDD启动,可是总是起不来,到了Verifying DMI Pool.............就停止了。 不知道什 ...… 查看全部问答> |
|
磁场 除了热噪声,电路引线在磁场中的运动也会产生寄生电压。即使地球相对很弱的磁场也会在摇摆的引线中产生纳伏级的噪声,因此引线应尽量短并严格固定好。 物理学基本原理认为磁场在电路中感应的电压大小与电路引线包围的面积成正比。因此,引 ...… 查看全部问答> |




