历史上的今天
返回首页

历史上的今天

今天是:2024年12月20日(星期五)

正在发生

2019年12月20日 | 面对异构挑战 英特尔oneAPI这个软件策略威力怎么样?

2019-12-20 来源:爱集微

回顾过去35到40年间计算的发展历程,计算力的增长速率呈指数级上升,从万物数字化、万物互联、万物移动化到万物云化,当前进入万物智能化。

在PC时代,互联网用户增长了十亿人。硬件和软件结合的典型例子就是PC上X86架构和Windows系统的结合。

进入移动化时代,从10亿的互联网用户增长到100亿的设备,呈现10倍的增长。硬件和软件的结合也发生了变化,变成了ARM架构和iOS及Android操作系统,同时Linux系统和X86平台也占据一部分市场。从10亿到100亿,实现的是指数级的增长。


进入以数据为中心的时代,异构计算也随之出现。

以往CPU、GPU、FPGA等,均可以独当一面。而当下,传统的通用架构已远不能满足需求。CPU、GPU、FPGA甚至AI加速器等多种架构之间组合,方能招架得住处理数据密集型、复杂的工作负载。未来,这种异构计算将成为常态。


一、应对多架构挑战 oneAPI应运而生

当前,不管是CPU、GPU、FPGA等哪一个硬件平台往往都需要开发者维护独立的代码库,这些代码库需要使用不同的语言、库和软件工具进行编程。这是一项极其复杂和耗费时间的工作,大大降低开发速度、抑制创新。

具体而言,异构计算使得一个用户可能在同一个数据中心里既需要CPU里做虚拟机,又需要FPGA来做各种解压缩或者加速器,还需要GPU来做深度学习或者人工智能。这就需要在数据中心里安各种各样的硬件,跑各种各样的软件。如果还是各自为政的话,对于用户来说,就算应用将来要扩容、硬件平台将来要升级,都是成本很高的一件事。甚至此前做的都全白做了。

为了解决这一难题,oneAPI应运而生。oneAPI是一个以开发者为中心的平台,简化多架构编程的一个统一编程模型,开发者可以自由选择架构,大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性。oneAPI采用统一、简化的语言和函数库,用于表达并行化,且基于行业标准和开放式规范,能够与现有 HPC 编程模型互操作。


oneAPI包括了一项基于开放规范的行业计划和一款beta产品。该规范包括一种编程语言、强大的API函数库以及底层硬件接口。oneAPI beta产品为开发者提供了全套的开发工具,包括编译器、编程库、分析器等,并把这些工具封装为特定领域的工具包。初期oneAPI beta版主要面向英特尔®至强®可扩展处理器、带集成显卡的英特尔®酷睿®处理器,以及英特尔® FPGA,未来还将支持更多硬件。

oneAPI将实现与现有行业标准的互操作性。oneAPI开放式规范包括一种跨架构的编程语言Data Parallel C++ (DPC++)、一套用于API编程的函数库以及底层硬件接口(oneAPI Level Zero)。有了这些组件,英特尔和其他企业就能创建他们自己的oneAPI实现来支持自己的产品,或基于oneAPI进行新产品开发。

oneAPI规范是为支持来自多个厂商的各种CPU和加速器而设计的。oneAPI beta版目前支持英特尔CPU(英特尔至强®、酷睿™、凌动)、英特尔Arria FPGA以及作为未来独立数据中心GPU代理开发平台的第九代/英特尔核芯显卡。oneAPI日后将支持更多英特尔加速器架构。

DPC++是基于大众熟悉的C和C++语言,专门为oneAPI设计的主要编程语言。它融合了来自Kronos Group的SYCL*,从而可以支持跨CPU和加速器上的数据并行和异构编程,目的是为了简化编程以及提高代码在不同硬件上的可重用性,同时能根据特定的加速器进行调优。

DPC++语言增强将会通过一个开发者社区项目来进行扩展,以简化数据并行编程。该项目向公众开放,并将通过开发者们的共同努力不断发展。

目前,很多库和组件已经开源或即将开源。英特尔一位工程师指出:“开发者有想法可以去做扩展,这对开发者来讲是没有太大阻碍的。第二个层面,我们做这个目的是因为后面计算会比较复杂,因为你可能有AI的应用,有后面更多的跨架构/跨平台的应用,还有各种框架上的支持,这些都是依赖于开发者对oneAPI的支持或者之后的发展,应该说本身它是一个发展的平台,它不是固定不变的东西。英特尔开了一个很重要的头,也投了大量的人力和物力,后面要做的话应该是开发者共同和我们一起把这个东西往前推的过程。”

用一个形象的比方,不同架构的选择如同是“自助餐”,有各种各样的菜,可以自由组合,想吃沙拉就吃沙拉,想吃红烧肉也可以。此前一些企业提供的方案是封闭性的,有的公司只供红烧肉,有的公司专门做沙拉。而有了oneAPI的支持,企业客户才能够更灵活的选择各种架构进行任意组合,oneAPI是通过软件来帮助实现硬件灵活组合的愿景。

二、OneAPI是英特尔软硬结合软件为先战略中的重要一步

现在数据量极其庞大,已经远远超出了在一台计算机上就可以完全处理的承载和能力,必须要清楚如何应对这些无法放进一台计算机的大规模数据的处理方式,这是巨大的机会。接下来面临的挑战是,如何将性能提升十倍、百倍,而并不是简单的提升10%的问题。

英特尔首席架构师Raja Koduri认为,摩尔定律将持续给我们带来非常好的性能提升;而通过软件和硬件的结合,可以让摩尔定律的提升变成十倍。因为摩尔定律会带来更多的晶体管,而软件可以将越来越多的晶体管的极致性能释放出来。将软件和硬件结合就是英特尔的战略重点,这也是未来面临的非常巨大的机会。


英特尔认为,对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来两个数量级的性能提升。英特尔首席架构师Raja Koduri表示: “通过软件优化,可以给Java带来6倍的性能提升,给持久性内存带来8倍的性能升级,在AI领域带来28倍的性能提升,所以它的性能提升空间是非常大的,而且这仅仅是在同一款硬件上通过软件就可以做到的。”
为此,2018年12月英特尔“架构日”活动上提出六大技术支柱战略,即:制程和封装、架构、内存和存储、互连、安全、软件。

“软件是英特尔的一项重要战略资产,英特尔将通过软件业务来充分释放公司的整体增长潜力。英特尔希望通过在整个开源生态系统中的协作,来推动面向以数据为中心时代的产品和服务创新。” 英特尔公司副总裁兼系统软件产品部门总经理苏义德曾强调。

英特尔拥有一个1200万活跃开发者的生态系统,横跨PC、网络和数据中心。不管客户有高性能的要求还是有低功耗要求,或者是对成本比较敏感,英特尔都有完整的产品线可以对应用户的不同需求。英特尔希望可以实现一个非常简化的流程,通过一个统一的软件栈,一个统一的API就可以适应客户所有的从性能、功耗到成本上的优化需求。

在软硬结合软件为先的战略中,英特尔在“架构日”活动上同时宣布推出“oneAPI”项目,面向多元化计算时代。该项目包括一个全面、统一的开发工具组合,以将软件匹配到能最大程度加速软件代码的硬件上。

“绝大多数AI算法的演进和创新都是在更偏上层来完成的,我们希望在底层就做好助力和驱动。同时,我们也会不断优化oneAPI。这样,未来任何编程人员不管是他们想将硬件性能提升10%、20%甚至50%,都可以在这个框架上轻松实现,而不需要再自己编写语言。”Raja Koduri表示。

2019年11月正式发布了oneAPI公开发行版本。oneAPI包括了一项基于开放规范的行业计划和一款beta产品。

英特尔指出,oneAPI不是一个全新的东西,它是之前几十年的积累上面做了一个扩展。基于现在工作负载越来越复杂,做这样的扩展是非常合情合理的一件事情。从现在整体来看,无论是开发效率还是实际的产品运营效率,都可以从中受益。

三、oneAPI重在培育生态系统 与伙伴共同拥抱数据时代

在设计oneAPI之初,英特尔就考虑到要发挥整个Xe架构最强的全面性能,不管是高性能还是低功耗。除此之外,oneAPI的设计也确保要符合英特尔所有其他不同计算和应用的需求。不管是CPU、FPGA还是加速器,oneAPI的设计都可以和它们进行非常完整的配合。

oneAPI,是英特尔以软件来最大程度释放硬件性能,从软件层面来简化和统一跨SVMS架构的创新。Raja Koduri指出,oneAPI是一个非常底层的抽象框架,主要就是面对以后不同计算元素的集成,希望能够从底层更好地完成特征抽象和集成。

SVMS架构是由标量(Scalar)、矢量(Vector)、矩阵(Matrix)、空间(Spatial)四种架构组成的,分别对应着CPU、GPU、FPGA和加速器,它们的组合方式是多种多样的。通过这个架构的分类方式可以看到,CPU是最通用的一种架构,而GPU会比CPU更加高效和专用,而FPGA和加速器的能效和灵活性更高。

“英特尔的策略就是要囊括CPU、GPU、FPGA、加速器所有的架构。” Raja Koduri指出,CPU依旧是目前最重要的架构,英特尔将不断提高每个CPU的性能,继续保持它作为最强的计算架构的位置。GPU战略主要是要提高能效,更好帮助英特尔提高整体的生产力和效率。在FPGA领域,英特尔现在已经做的非常成功了,英特尔推出了很多重要的FPGA产品。另外,加速器也是英特尔非常重要的一个发力点。

在oneAPI的生态构建方面,英特尔主要从三个层面来推进:一是英特尔有着强大的开发者社区,以及全球范围内非常广泛的社区合作伙伴。英特尔将从自身非常擅长的开源社区入手。第二,在很大层面上与高校展开配合协作,结合他们的技术以及案例来打造一个完整的社区。第三,与全球开发者们进行更加完整的合作,开发者不仅仅是指个人开发者,也包括大型的企业机构,例如腾讯、阿里等,英特尔将会与每个人、每个企业都紧密地配合,来支持oneAPI的生态。

截至11月17日,支持oneAPI概念的业内领先企业和研究机构已经超过30家,包括高性能计算领域的领导者、人工智能领域的创新者、硬件厂商/OEM、独立软件开发商、云服务商、高校等等。

2019年5G的正式商用加速了物联网的深入应用,这意味着会有更多的物联网节点智能终端产品落地应用。据统计数据显示,2020年全球物联网设备基数将达307亿台,2025年将达到754亿台。而这些将会产生海量的数据,这些数据的存储、安全、运算,则需要依赖于数据中心、云服务等软件业务。

英特尔愿发挥在软件业务方面的强优势,以生态系统培养为主,推动整个业界往前迈进。并与合作伙伴一起面对这一巨大的市场应用需求,一同抓住这块蛋糕。


推荐阅读

史海拾趣

HANBIT Electronics公司的发展小趣事

Hamamatsu(滨松光子学株式会社)在电子行业中的发展故事丰富多样,以下是根据公开信息整理的五个相关故事,每个故事均力求准确描述事实:

1. 光电倍增管的创新与突破

Hamamatsu在光电倍增管(PMT)领域取得了显著成就。光电倍增管作为宇宙线观测、中微子实验等高精度探测中的关键器件,其性能和技术要求极高。Hamamatsu抓住市场需求,与东京大学高能物理实验室等科研机构合作,成功研制出大面积探测用光电倍增管,并在多个国际中微子探测实验中得到应用。这一创新不仅推动了Hamamatsu自身的发展,也巩固了其在光电倍增管市场的领先地位。

2. 光电二极管的多样化应用

Hamamatsu的光电二极管产品线广泛,包括硅PIN光电二极管、InGaAs PIN光电二极管等多种类型,广泛应用于医疗生物、高能物理、宇宙探测、精密分析等多个领域。这些产品的多样化应用不仅展示了Hamamatsu在光电技术领域的深厚积累,也为其在全球市场的拓展提供了有力支撑。

3. 光电技术的国际合作与交流

Hamamatsu积极参与国际光电技术的交流与合作,通过举办大型展会、参与国际学术会议等方式,展示其最新的光电技术和产品。例如,Hamamatsu举办的PHOTON FAIR展会,吸引了来自全球的客户和合作伙伴,促进了光电技术的国际交流与合作。这种开放合作的态度,有助于Hamamatsu不断吸收国际先进技术,推动自身技术的持续进步。

4. 应对市场变化的灵活策略

面对电子行业的快速变化,Hamamatsu展现出了高度的市场敏感性和灵活性。当市场需求发生变化时,Hamamatsu能够迅速调整产品结构和研发方向,以满足新的市场需求。例如,在消费电子市场兴起时,Hamamatsu也积极涉足相关领域,推出了一系列适用于消费电子产品的光电传感器件。这种灵活的市场策略,使得Hamamatsu能够在激烈的市场竞争中保持领先地位。

5. 人才培养与团队建设

Hamamatsu深知人才是企业发展的根本动力,因此高度重视人才培养和团队建设。公司建立了完善的人才培养体系,通过内部培训、外部交流等多种方式,不断提升员工的专业技能和综合素质。同时,Hamamatsu还注重团队建设和企业文化建设,营造了一个积极向上、团结协作的工作氛围。这种良好的人才环境和企业文化,为Hamamatsu的持续发展提供了有力保障。

以上五个故事展示了Hamamatsu在电子行业中的发展历程和成就,体现了其在技术创新、市场拓展、国际合作、灵活应变以及人才培养等方面的综合实力。

DUCATI公司的发展小趣事

在电子行业中,DUCATI公司(杜卡迪摩托控股公司)的发展历程尤为独特,它从一个无线电通信技术的研究和生产公司,逐渐发展成为享誉全球的摩托车生产商。以下是五个与DUCATI公司电子行业起源及其后来摩托车业务发展起来的相关故事:

  1. 无线电通信技术的奠基

1926年,DUCATI家族工程师Antonio Cavalieri Ducati与意大利波隆那地区的绅士合作,成立了杜卡迪无线电器材制造公司。公司专注于无线电通信技术的研究和生产,为后来的发展奠定了坚实的基础。尽管当时并未涉足摩托车行业,但这一技术积累为公司带来了重要的经验和资金储备。

  1. 战火中的坚持与转型

第二次世界大战期间,杜卡迪的工厂不幸毁于战火。然而,在战后的废墟中,公司看到了对车辆需求的逐渐增加。不久后,杜卡迪开始踏入其他工业领域,为后来的摩托车业务探索了新的道路。这种逆境中求生存、转型谋发展的精神,是杜卡迪文化中不可或缺的一部分。

  1. Cucciolo引擎的突破

1946年,杜卡迪推出了企业史上的第一具单汽缸引擎Cucciolo。这款引擎由当时的意大利工业振兴协会管理,设计者为都灵的SIATA公司。虽然最初只是装置在脚踏车上的小型引擎,但这一突破性的技术为杜卡迪进入机车制造领域打开了大门。Cucciolo引擎的成功研发,为杜卡迪摩托车部门的成立奠定了基础。

  1. Cruiser机车的问世

1952年,杜卡迪推出了第一部配备电动启动马达和自动变速系统、排气量175cc的机车Cruiser。这款机车标志着杜卡迪正式成为机车制造厂,并为其在摩托车行业的地位奠定了基础。Cruiser的成功问世,进一步巩固了杜卡迪在摩托车市场的地位。

  1. Monster与916的辉煌

进入90年代后,杜卡迪在摩托车设计和技术上取得了重大突破。1993年,阿根廷设计师Miguel Galluzzi设计的Monster为杜卡迪在财务危机的愁云惨雾中找到了曙光。而1994年推出的916更是杜卡迪划时代的革命性作品,这款车型获得了世界经典名车的殊荣。Monster和916的成功设计不仅展现了杜卡迪在摩托车设计上的独特魅力,也为其在全球市场上赢得了广泛的赞誉。

以上五个故事展示了DUCATI公司在电子行业中的起源以及后来摩托车业务的发展过程。这些故事不仅体现了公司的创新精神和技术实力,也展现了其在逆境中求生存、转型谋发展的坚定信念。

安纳森(AnaSem)公司的发展小趣事

随着技术的不断成熟和市场的逐步扩大,安纳森开始将目光投向更广阔的全球市场。公司积极与全球各地的合作伙伴建立战略合作关系,共同开拓市场。同时,安纳森还设立了多个海外研发中心和销售网点,以便更好地了解当地市场需求,提供更贴近用户的产品和服务。这一系列的全球化布局,不仅提升了安纳森的品牌影响力,也为其未来的发展奠定了坚实的基础。

华宇创公司的发展小趣事

在21世纪初,电子科技正处于蓬勃发展的时期。李华,一位在电子行业摸爬滚打多年的工程师,决定创立自己的公司——华宇创,专注于智能电子设备的研发和生产。创业初期,华宇创面临着资金短缺、技术瓶颈等诸多挑战。然而,李华凭借对技术的热情和坚定的信念,带领团队日夜兼程地研发新产品,最终成功推出了首款具有竞争力的智能手环,获得了市场的初步认可。

汇顶科技(GOODiX)公司的发展小趣事

面对不断变化的市场环境和客户需求,华宇创始终将创新作为企业发展的核心动力。公司不断投入研发资源,探索新的技术方向和应用场景。同时,华宇创还关注行业发展趋势和未来市场需求,及时调整产品策略和市场布局。展望未来,华宇创将继续秉承创新、品质、合作的理念,致力于成为全球领先的智能电子设备供应商和服务商。

Cavium Networks公司的发展小趣事

在电子行业的快速发展中,Cavium Networks 公司凭借其创新的技术和敏锐的市场洞察力,成功推出了基于 MIPS64 的单核和双核 OCTEON 处理器系列。这款处理器为网络、无线、控制和存储应用提供了高度集成化和低成本的64位计算解决方案,成为当时业界领先的面向下一代智能网络的新型处理器。OCTEON 处理器的诞生,标志着 Cavium Networks 在网络通信领域的技术实力得到了进一步提升,也为其后续的发展奠定了坚实的基础。

问答坊 | AI 解惑

请问后缀为PCB的文件用什么软件打开呢

请问后缀为PCB的文件用什么软件打开呢请问后缀为PCB的文件用什么软件打开呢 谢谢了…

查看全部问答>

程序滤波(很多信号采集实用)

1、限幅滤波法(又称程序判断滤波法)     A、方法:         根据经验判断,确定两次采样允许的最大偏差值(设为A)         每次检测到新值时判断:    &n ...…

查看全部问答>

飞凌S3C2440开发板路由实验代码

PS:本文转自 飞凌嵌入式技术交流群 这个是由群里一些工程师朋友做的小实验,可以作为参考。 嵌入式Linux简单路由实验     本实验所用硬件平台为飞凌(www.witech.com.cn)TE2440V2型开发板;该开发板上有两个网卡芯片,分别为C ...…

查看全部问答>

关于WINCE6.0 VS2005 “go to definition ”功能 无法定位相关内容

关于WINCE6.0 VS2005 “go to definition ”功能 无法定位相关内容 大家好!向大家请教一个问题: 我现在装了VS2005 打开mini2440的BSP包(缺省内核工程),可以编译内核通过。 我想用go to definition 功能跟踪一下程序,比如定位一个函数或 ...…

查看全部问答>

请教一个电路

    各位大大,我有一块GR47模块,想做一个最简单的外围电路,只要SIM卡槽和一些必要电路。用串口和PC连,可以发彩信。。。哪位可以告诉我这个电路可以怎么做啊?…

查看全部问答>

在手机上,如何实现自己的软件中嵌入摄像头功能,

请问大家-有没有从事过在自己的软件中嵌入摄像头功能,就是自己的软件能够同过手机的摄像头照相,并且存储,而不是用手机自带的照相机。 有这方面的书也可以,大家介绍下吧,急用。 …

查看全部问答>

大侠帮忙

现在小弟我手上有款ARM开发板、是周立功出的。型号是easyarm2104 但是所有相关的资料全丢了。有哪位大侠有的,能共享下吗?不胜感激。…

查看全部问答>

EVC3.0+PPC202程序编译出错,关于StdAfx.sbr

Compiling resources... Compiling... Error spawning clarm.exe Creating browse info file... BSCMAKE: error BK1506 : cannot open file \'.\\ARMRel\\StdAfx.sbr\': No such file or directory Error executing bscmake.exe. Main.exe - ...…

查看全部问答>

5438与仿真器终于连上了

可以连上,必须把JTAG口RST脚上的电容拿掉,但又碰到了新问题:在线仿真5438时速度极慢,下载操作需1分钟左右,执行一个单步需十几秒,执行一次复位需半分钟,运算结果倒是正确的。iar是4.20.1版,操作系统是vista,仿真器是USB型的LSD-FET430UIF, ...…

查看全部问答>

急求助:Linux无法从NFlash(K9F1208U0A)启动

自己开了一个ARM架构板, CPU: S5PC100, SDRAM: K4T1G164QQ(两颗),Nand flash: K9F1208U0A。现在系统能从SD卡启动,对FLASH擦除操作后返回OK,但将SD卡取后,从FLASH启动串口不出现任何信息。有没有人知道是哪里出了问题,急求大家的帮助,不甚 ...…

查看全部问答>