历史上的今天
返回首页

历史上的今天

今天是:2025年05月10日(星期六)

正在发生

2021年05月10日 | 赛灵思神经网络加速库 实现FPGA的高效深度学习运算

2021-05-10 来源:爱集微

不久前,AMD和FPGA大厂赛灵思的股东以压倒性多数批准AMD以350亿美元收购赛灵思,这则消息引起了无数“电子人”的关注,要知道,这将是目前芯片行业最大规模的交易之一,上一回还要追溯到英伟达收购ARM。

在电子行业,赛灵思的FPGA芯片一直被行业所推崇,而随着机器学习、深度学习的兴起,也有许多研究者开始将这些智能算法应用在FPGA芯片上。

机器学习是使计算系统无需明确编程即可采取行动的科学,传统机器学习包括各种聚类和分类技术,包括K-means聚类、线性和逻辑回归、随机梯度下降、关联规则学习等。而深度学习则是机器学习中较为前沿的内容,通常依赖于人工神经网络来实现。人工神经网络(CNN)非常适合处理图像或视频数据,其衍生以及变体网络,例如DNN、RNN等,也非常适合处理语音和文本数据。

为了能在FPGA上执行神经网络任务,以达到和GPU中相同的运行效率,就需要提高FPGA的利用率以及提高针对于神经网络的运行效率,这样才能提高神经网络应用在FPGA上的性能。然而,就目前的技术而言,还缺少充分利用FPGA性能进行人工智能算法运算的技术。

为此,赛灵思在18年9月26日申请了一项名为“用于神经网络加速的机器学习运行时库”的发明专利(申请号:201880067685.8),申请人为赛灵思公司。

根据目前该专利公开的相关资料,让我们一起来看看这项用于神经网络加速的机器学习运行库方案吧。

如上图,为该专利中发明的用于使神经网络加速器与神经网络应用结合的系统,该系统主要包括主机105和FPGA 150,主机包括处理器110和存储器115,在存储器中配置有神经网络应用120,用于处理存储在存储器中或者来自外部的数据。例如,主机可以与门户网站相耦合,门户网站接收用户提交的图像,然后交由神经网络处理。

而在FPGA中,存储器中的神经网络也可以耦合于其中的神经网络加速器165,以改善神经网络的性能。神经网络通常包含多个网络层,不同层有不同的操作运算,可以通过FPGA对网络的性能进行改善,而不是仅仅依赖于处理器。

此外,在主机中配置有另一个重要的模块:神经网络库130,其可以提供将神经网络应用通信地耦合到神经网络加速器的方法和操作,库中存储器映射140和流水线式阶段135。存储器映射将神经网络应用分配的存储器块映射到FPGA中,为FPGA运算提供数据;流水线式阶段对要由神经网络加速器完成的任务进行提交,以此并行处理不同阶段的多个任务。

如上图,为用于流水线化从神经网络应用接收的任务以用于在神经网络加速器中执行的流程图,首先,由主机中的库从神经网络应用中接收新任务,库中的存储器映射存储指针将主机中分配的存储器子块映射到执行神经网络加速器的FPGA中的对应存储器块。因此,存储器映射可以使分配给神经网络应用的主机中的存储器与分配给神经网络加速的FPGA中的存储器同步。

其次,库生成第一数据分组,包含由流水线式阶段用于执行任务的信息,库使用与流水线中的每个阶段相对应的线程来处理第一数据分组。也就是说,因为分组是独立的,所以流水线可以并行地处理来自于不同数据源的分组,通过不同的分组并行地计算任务,由此可以实现神经网络加速的目的。

以上就是赛灵思发明的用于神经网络加速的机器学习运行库,该方案在主机中配置了专门用于神经网络训练的运行库,以在库中将任务进行分组,并行地交由FPGA处理器进行运算,相比于传统未分块、分组的数据传输方式,这种方案无疑较好的实现了高效率的神经网络计算。


推荐阅读

史海拾趣

BLACK&DECKER公司的发展小趣事

BLACK&DECKER一直致力于产品革新和专利申请。1914年,公司为世界第一台配有枪式手柄、扳机开关和通用马达的便携式手电钻申请了专利。这一发明极大地提高了工作效率,并在市场上取得了巨大的成功。此后,BLACK&DECKER不断推出创新产品,如1946年发明的世界上第一台专为家用消费者设计的便携式电钻,以及后续的电动篱笆剪、全绝缘电钻等一系列重要发明。

无锡友达公司的发展小趣事

无锡友达注重企业文化建设和团队建设,致力于为员工创造一个良好的工作环境和发展空间。公司设有完善的培训及考核晋升制度,员工上升空间广阔。同时,无锡友达还积极与省内各大高校合作,建立产学研基地,培养出一二级工程师50余名。这些优秀的人才为公司的发展提供了有力的人才保障。

请注意,以上故事均为根据公开信息概括的框架性内容,具体细节可能因实际情况而有所不同。

DAICO公司的发展小趣事

随着技术的不断进步,DAICO公司成功研发出一系列高可靠性的定制产品。这些产品以其卓越的性能和稳定性,赢得了客户的广泛认可。DAICO开始将业务扩展到商用飞机和其他高端商业行业,为卫星、雷达、导航、通信、电子战和导弹系统提供复杂操作不可或缺的一部分。

Chino-Excel公司的发展小趣事

随着公司规模的扩大,Chino-Excel公司开始实施全球化战略布局。公司先后在多个国家和地区设立研发中心和生产基地,以充分利用当地资源和市场优势。同时,公司加强与全球合作伙伴的紧密合作,共同开发新产品和技术,进一步巩固了在全球市场的地位。

Esico-Triton公司的发展小趣事

Esico-Triton公司成立于XXXX年,起初是一个小型的电子设备研发团队。当时,创始人[XXXXX]和[XXXXX]看到了电子设备市场的巨大潜力,于是决定合作创办一家公司。他们的初衷是开发一款能够简化工作流程的电子设备。在公司创立初期,资金紧张,研发条件有限,但团队成员凭借着对技术的热情和专业知识,成功研发出了第一款产品——一款便携式数据处理器。这款产品因其便携性和高效性受到了市场的欢迎,为Esico-Triton的后续发展奠定了坚实的基础。

ADLINK公司的发展小趣事

进入XXXX年代,Esico-Triton开始将目光投向国际市场。公司积极参加国际电子展会,与世界各地的潜在客户和合作伙伴建立联系。通过不断的市场调研和产品调整,Esico-Triton成功打入欧洲和亚洲市场,产品的国际知名度逐渐提升。

问答坊 | AI 解惑

日韩从e到u的国家信息化战略转移

      随着无所不在的运算(ubiquitous computing)及移动通讯技术发展,人们逐渐以u(ubiquitous,意指“无所不在”)来取代e用以描述信息化事物,各国也纷纷将“无所不在”作为国家信息化战略发展的一个关键要素。 ...…

查看全部问答>

调89C2051通讯的吐血经验

调了15天,终于调通了。刚上网。先跪谢midsky的帮助,提供了汇编的正确程序,最重要的是使我确信是硬件出了问题!!!想想又吐血,所有的片子都是新的。线路稳定可靠,用万用表分段测过。程序又没问题。是不是COM口坏了,咳,害的我换了两台机器实 ...…

查看全部问答>

英文简历的几种常见形式

英文简历的几种常见形式英文简历并无固定不变的单一形式,应聘者完全可以根据个人的具体情况来确定采用何种形式,灵活设计。一般来说,根据个人经历的不同侧重点,可以选用以下三种形式:   (1)以学历为主的简历 basic resume     ...…

查看全部问答>

电话原理图

电话原理图介绍…

查看全部问答>

关于加班的问题

一位研发老总的问题:我们常常为研发人员不愿意加班而苦恼,或说公司未能形成加班的风气. XXX区这边,有时我们晚一点下班,可以看到其它公司灯火通明. HXX公司这方面做得特别好,不知你有没有什么好办法? 顾问答复:您好! 讲实话,我当初在HXX公司 ...…

查看全部问答>

海洋投影灯在家中体验水族馆的浪漫氛围

无论你在浴室,起居室,卧室,都可以安享美丽动人的水光波漾~ 同时更有音频插孔连接 iPod 等各类设备,作为外接音箱使用,让您在潺潺的水声中,舒缓的乐曲中,彻底放轻松…

查看全部问答>

ARM开发板,核心板一般引出哪些接口啊?

ARM开发板,很多采用核心板+底板的方式,方便二次开发.核心板和底板之间一般留哪些接口?…

查看全部问答>

请教一个异步的问题

时钟CLKA与CLKB,可否这样操作一个信号(en):     时钟CLKA下检测到某条件(A)时,将en置为“1”;     然后时钟CLKB检测到en为高后,输出一个时钟宽度的脉冲,并将en拉低,置为“0”? 烦请各位高手告之,这样做可不可 ...…

查看全部问答>

2440SPI驱动问题请教。

大家好:     这两天搞SPI驱动,2440的SPI寄存器里面有一个发送数据寄存器和一个读数据寄存器。小弟想请问一下,这两个寄存器都是8位的。 问题:     (1)现在如果我写了一个byte的数据到发送的寄存器,我什么时候才能继续 ...…

查看全部问答>

EVC下将string型转成char*类型

EVC下将string型转成char*类型. CString   str(_T(\"01234567\"));    char   *ch   =   str.GetBuffer(0); 这在VC6.0中编译没任何问题.但EVC下编译出错. error c2440:\"initializing\":ca ...…

查看全部问答>