历史上的今天
返回首页

历史上的今天

今天是:2025年01月26日(星期日)

2019年01月26日 | 2018年全球最值得关注的AI芯片初创公司

2019-01-26 来源:雷锋网

在《芯片巨头们2019年的AI芯片之争会如何?》一文中作者Karl Freund详细介绍了巨头公司们的AI芯片。此外,还有数十家硅谷创业公司和中国独角兽公司估值超过10亿美元,并且也参与了AI芯片的竞争。在本文中,作者将介绍全球的最杰出,或至少是最受关注的AI芯片创业公司。

Wave Computing

Wave Computing在2018取得了不少进展,推出其第一个DataFlow处理单元,收购MIPS,创建MIPS Open,并将首批系统交付给少数客户。虽然Wave架构有一些非常有趣的功能,但我们更期待用户的大规模真实体验反馈。

Wave不是插入到服务器的加速器,它是用于图形计算的独立处理器。这种方法有利有弊。从积极的方面看,Wave不会受到GPU等加速器面临的内存瓶颈影响。从消极方面来说,安装Wave设备将是新的升级,需要完全替换传统的X86服务器,也让其成为所有服务器制造商的竞争对手。

我不认为Wave能从某个点击败NVIDIA,但该架构的设计的非常好,该公司已经表示它很快就会有客户的反馈。

图1:Wave是从上面显示的4节点“DPU”构建的系统。Wave Computing

Graphcore

Graphcore是一家资金雄厚(融资3.1亿美元,目前估值为17亿美元)的英国独角兽创业公司,拥有全球化的团队。它正在构建一种新型的图形处理器架构,其内存与其逻辑单元位于同一芯片上,这应该能够实现更高的性能。该团队产品的发布时间暂不明确,不过他们去年四月表示“几乎准备好发布”了,12月的最新信息表明它将很快开始生产。

Graphcore的投资者名单令人印象深刻,包括红杉资本、宝马、微软、博世和戴尔科技。

我了解了该公司的架构,它非常令人印象深刻。从边缘设备扩展到用于数据中心的训练和推理的“Colossus”双芯片封装。在最近的NeurIPS活动中,Graphcore展示了其RackScale IPU Pod,它在一个32台服务器的机架中提供超过16 petaflops的算力。虽然该公司经常声称它将提供比同类最好GPU强100倍的性能。

Graphcore表示,4“Colossus”GC2(8芯片)服务器可提供500 TFlops(每秒数万亿次操作)的混合精度性能。单个NVIDIA V100可提供125 TFlops,因此理论上4 个V100就可提供与其相同的性能。

与往常一样,细节更能发现差别,V100峰值性能仅在重构代码执行TensorCore的4x4矩阵乘法时才可用,这是Graphcore架构巧妙避免的限制。更不用说V100消耗了300瓦的电能和大量现金这一事实。

此外,Graphcore支持片上互连和“处理器内存”(片上存储器)方法,可以得到超出TFlops基准所认可的优秀性能。在一些神经网络中,如Generative Adversarial Networks,内存是瓶颈。

再次强调,我们将不得不等待真实的用户用实际应用程序来评估此体系结构。尽管如此,Graphcore的投资者名单、专家名单和台天价估值告诉我,这可能是一件好事。

图2:GraphCore展示了ImageNet数据集处理的照片。 可视化可帮助开发人员了解其训练处理占用处理周期的位置。

Habana Labs

Habana Labs是一家以色列创业公司,去年9月在第一次AI硬件峰会上宣布它已经准备好推出其首款用于推理的芯片,其创纪录的性能用于卷积神经网络图像处理。结果显示在Resnet50图像分类数据库中该处理器每秒分类15,000张图像,比NVIDIA的T4高出约50%,功耗仅为100瓦。

在2018年12月,Habana Labs的最新一轮融资由英特尔风险投资(Intel Venture Capital)领投,WRV Capital,Bessemer Venture Partners和Battery Ventures跟投,该公司的融资也由此前的4500万美元增加了7500万美元。

据悉,Habana Labs新的融资将部分用于流片其名为“Gaudi“的第二款芯片,该芯片将专注于训练市场,据称可扩展到1000多个处理器。

其它创业公司

我知道世界上有超过40家公司在为人工智能设计训练和推理芯片。我发现大多数公司都在进行简单的FMA(浮点乘法累加)和混合精度数学(整型8位和浮点16位和32位)。对此我不会感到惊讶,因为这种方法相对容易实现并且会获得一些成果,但它不会为像NVIDIA,英特尔以及少数初创公司做出不一样的架构提供持久的架构优势。

以下是一些引起我注意的公司:

Groq:前Google员工创立,从事TPU工作,他们有雄心统治世界其他地区。

Tenstorrent:加拿大前AMD员工创立,目前仍处于保密阶段。我只能说其首席执行官的愿景和架构给我留下了深刻的印象。

ThinCi:印度公司专注于边缘设备和自动驾驶汽车,与三星和Denso建立了合作伙伴关系。

Cerebras:由前SeaMicro(雷锋网注,AMD子公司,专注于超密集计算机服务器行,在2015年4月16日停止运营)员工领导,包括Andrew Feldman,目前仍处于深度“隐身”模式。

Mythic:一家采用独特方法进行边缘推理处理的创业公司,类似于非易失性存储器上的模拟处理; 应该在2019年有芯片。

中国AI芯片初创公司

中国一直试图找到一条摆脱美国半导体的方式,人工智能加速器可能会提供它一直在寻求的机会。中国设定了2030年要建立一个价值数万亿美元的人工智能产业的目标,自2012年以来,投资者已经向创业公司投入了超过40亿美元的资金。

美国国会称这是一场人工智能军备竞赛,美国科技产业可能落后于中国公司和研究机构,因为其不太关注阻碍西方进步的隐私问题。

Cambricon(寒武纪科技)和SenseTime(商汤科技)可能是最值得关注的中国人工智能玩家,但像边缘AI这样的玩家更关注Horizon Robotics(地平线)。此外,大型科技公司如百度、华为、腾讯和阿里巴巴也值得关注,所有这些公司都对人工智能软件和硬件进行了大量投资。

寒武纪科技估值为25亿美元,是已经发布了第三代AI芯片的中国独角兽公司。寒武纪称它可以用更低的功耗提供比NVIDIA V100更好的AI性能,他们还销售其AI IP,搭载在华为麒麟970和麒麟980的处理器当中,作为AI加速硬件。

商汤科技也许是估值最高的AI创业公司,以在中国推广智能监控摄像头而闻名。这些安防摄像头数量超过1.75亿,包括其他公司生产的摄像头。商汤科技在香港成立,最近一轮融资数额达6亿美元,由阿里巴巴领投。据报道,这家初创公司的价值目前为45亿美元。

商汤科技与阿里巴巴、高通、本田甚至NVIDIA等主要公司建立了战略合作伙伴关系。该公司今天拥有一台超级计算机,运行大约8000块(可能是NVIDIA提供?)GPU,并计划再建造5台超级计算机来处理数百万个摄像头采集的面部识别数据。


推荐阅读

史海拾趣

艾迪沃德公司的发展小趣事
使用万用表检测整流桥和滤波电容是否正常工作,如有损坏需更换。
Electro-Mech Components Inc公司的发展小趣事

EMC一直致力于技术研发和创新能力的提升。公司拥有一支专业的研发团队,不断投入资金和人力进行新产品的研发和技术创新。通过不断的努力,EMC在电气元件领域取得了多项专利和技术成果,其产品质量和技术水平在行业中处于领先地位。同时,EMC还积极参与行业标准的制定和推广工作,为推动整个行业的发展做出了积极贡献。

Erocore Enterprise Co Ltd公司的发展小趣事

Erocore Enterprise Co Ltd公司自XXXX年在电子行业中创立之初,就专注于电子元件的研发和生产。公司创始人深知技术是企业发展的核心,因此投入大量资源用于技术研究和人才引进。在初创期,Erocore通过不断的技术创新,积累了一定的技术储备和行业经验,为其在后续的市场竞争中奠定了坚实的基础。

动运科技(DONGWOON)公司的发展小趣事

动运科技(DONGWOON)公司,最初成立于1987年(也有资料称为1988年)的韩国首尔,是一家专注于模拟和功率驱动IC研发的半导体公司。在初创阶段,公司凭借对半导体技术的深刻理解和不懈追求,逐渐在模拟IC领域积累了技术和市场经验。通过不断的技术创新和产品优化,动运科技逐步获得了业界的认可,为其后续的发展奠定了坚实的基础。

DFRobot公司的发展小趣事

为了进一步提升品牌影响力和市场竞争力,DFRobot积极寻求国际合作机会。他们与国际知名的开源硬件品牌建立了合作关系,共同推广开源硬件和机器人技术。同时,DFRobot还积极参加各类国际展览和论坛活动,展示公司的最新产品和技术成果。这些国际合作和交流活动不仅提升了DFRobot的品牌知名度,也促进了公司与国际同行的交流与合作。

Electron Products Inc公司的发展小趣事

Electron Products Inc(简称EPI)成立于XXXX年,由一群对电子技术充满热情的工程师共同创立。初期,公司主要从事电子产品的设计和研发,致力于为小型企业和消费者提供高质量的电子产品。通过不断创新和优化产品,EPI逐渐在市场上树立了自己的品牌形象。

问答坊 | AI 解惑

Schematic Entry in OrCAD

Schematic Entry in OrCAD…

查看全部问答>

s3c2416 sd interface

This register is used to store responses from SD cards. Register Address R/W Description Reset Value RSPREG0_0 0X4AC00010 ROC Response Register 0 (Channel 0) 0x0 RSPREG1_0 0X4AC00014 ROC Response Register 1 (Channel 0) 0x0 RSP ...…

查看全部问答>

急求大侠帮忙!!!!

晶振频率11.0592MHZ 源程序如下: 问题是 利用串口调试软件运行时,反复输入U后经采样转换数据不一致,即模拟信号转成数字量的值 跳变太大。。。请教专家!!! CS        BIT        P1.1   &n ...…

查看全部问答>

救助要三极管做开关的问题

我做了一个模块,但是想在电源部分(图中黑色箭头的位置)加个开关,准备用三极管做。三极管可以选2SA1213或者是S8050都行,用430单片机的I/O口来控制三极管截止和饱和,但是不知道该怎么做。430单片机的I/O口输出应该是3.3V,但是要控制7.5V的电压 ...…

查看全部问答>

版主,能否提供一个使用芯片内部HSI设置的示例?

                                 版主,能否提供一个使用芯片内部HSI设置的示例?…

查看全部问答>

以下这种温度与电阻对应的热门电阻是那种类型

拟采集土壤的温度,参考别人有用于冻土研究的论文(青藏铁路冻土地温自动检测系统),其中用到了热敏电阻,对应温度与电阻关系如下----------------------------------电阻与温度的关系------------------------------温度/℃    &# ...…

查看全部问答>

【贡献闲置】响应号召回馈论坛

好久就和soso说过想捐出来这块板子给能用的上的朋友,正好有这次机会   我的这块板和辛昕的那块利尔达的板子是一样的,也是参加mcuday 赠送的,那一年送的都是这个。   当时现场演示的时候,可以直接用单片机和网口相连,因为我做的 ...…

查看全部问答>

急求,谢谢各位大神,小弟感激不尽,如何将数字信号通过I2C接口传入CPLD中?

急求,谢谢各位大神,小弟感激不尽 如何将数字信号通过I2C接口传入CPLD中?需要VHDL语言的,不是verilog…

查看全部问答>

毕业设计,要求自己做一个传感器,要求能产生特定频率并检测信号强度

毕业设计,要求自己做一个传感器,要求能产生特定频率(模拟GSM范围,或WIFI范围频率)并检测信号强度,用现成的Zigbee设备进通讯,请问传感器如何设计?发送模块应该包括振荡器,放大器,天线,接收模块包括滤波器,低噪声放大器,天线,对么?各 ...…

查看全部问答>