历史上的今天
返回首页

历史上的今天

今天是:2024年11月25日(星期一)

正在发生

2020年11月25日 | 为AI注入了一个大心脏,Mythic公司模拟矩阵处理器问市

2020-11-25 来源:半导体行业观察

领先的模拟AI处理器公司Mythic日前宣布,公司正式推出业界首款模拟矩阵处理器(Mythic AMP™)M1108 AMP。按照他们的说法,这个新产品的发布预示了AI激动人心的新纪元,因为它首次提供了一种模拟计算解决方案,该解决方案可实现一流的性能和性能,并且其精度可与数字设备媲美。 


See the source image

报道指出,M1108 AMP能为边缘部署提供了无与伦比的可能性,应用市场包括智能家居,AR / VR,无人机,视频监控,智能城市以及工厂车间的自动化。凭借其革命性的技术,M1108 AMP处于AI处理重大新趋势的最前沿。

 

报道指出,M1108集成了108个AMP tiles ,每个tiles都配有一个Mythic模拟计算引擎(MythicACE™),该引擎具有闪存单元、ADC阵列、32位的RISC-V处理器、SIMD矢量引擎,SRAM和一个高吞吐量的片上网络(NOC)路由。


此外,四个控制tiles为系统主机处理器提供了高带宽PCIe2.0接口。M1108具有108个AMP tiles,可提供高达35万亿次/秒的运算(TOPS),可在单个芯片上以高效率、低延迟地高效执行复杂的AI模型(例如ResNet-50,YOLOv3和OpenPoseBody25)。在峰值吞吐量下运行复杂的AI模型时,M1108的典型功耗约为4W。而且,凭借利用成熟的40nm技术的固有成本优势,并且不需要任何外部DRAM或SRAM,M1108 AMP将以PCIe M.2和PCIe卡形式提供,并且M1108PCIe评估套件可应要求提供。


模拟AI芯片怎么玩?Mythic详细讲述



说到人工智能硬件,我们向来事无巨细。WikiChip密切关注的一家公司是Mythic。这家公司还没有完全公开他们的架构和产品,但一些细节已经开始慢慢浮出水面。在最近的人工智能硬件峰会上,该公司的创始人兼首席执行官Mike Henry)绍了该芯片的最新情况。


这家位于奥斯汀的初创公司由Mike Henry和Dave Fick于2012年创立,最近完成了7000万美元的B轮融资,总融资额刚刚超过8500万美元。如今,公司员工已增至110人。


Mythic是一家模拟公司。但是,在我们探讨细节之前,必须指出,它们目前仅专注于推理,无论是在数据中心还是在边缘。到2024年,这两个市场的TAM(Total Available Market总体有效市场)


预计将达到250亿美元,这就是为什么这里有如此多的关注点的原因。从长远来看,Mythic计划针对大众市场的消费品和汽车产品。


把所有东西都放在芯片上,放在闪存里



随着模型准确性的提高,其大小也会随之增加。如今,模型达到了数亿个参数,甚至达到数十亿。最重要的是,通常实时地需要确定性行为,例如一致的帧速率和延迟。这就是Mythic的作用。Mythic的论点很简单:将足够的存储与大量并行计算单元打包在芯片上,以最大化内存带宽并减少数据移动的能力。但是有一个转变——这就是Mythic的原始方法的闪光点——该公司抛弃了传统的SRAM,转而使用更密集的闪存,此外,Mythic还计划在模拟环境下直接在内存中进行本地计算。


但是为什么是闪存?答案很简单:因为它密度大,功耗低,而且便宜,几乎比SRAM的密度大两个数量级。



理论上,Mythic的芯片更像内存,而不是传统的CMOS。从更长的路线图来看,随着SRAM bit cell的扩展变得越来越困难,它带来的好处也越来越深远。总的来说,从每美元的性能、每单位成本的密度和每瓦特的性能来看,这是一个潜在的巨大胜利。


多年来,我们看到了一大堆路线图,当他们开始谈论未来10年的时候,很容易忽视它。但对Mythic来说,有一些不同之处。值得特别指出的是,目前Mythic正在研究40纳米的嵌入式闪存。他们有一个相当清晰的28nm和22nm的路径,因此,粗略地说,这个图的一半是基于今天已经发布的现有节点。


Mythic公司的首席执行官Mike Henry似乎相信他们可以继续这样做,但是尽管正在进行一些工作以继续扩展到16/14纳米节点,还不清楚它是否会上市。



许多业内人士认为,嵌入式闪存在22纳米的时候遭遇了瓶颈。在与Mythic的一次简短交谈中,他们告诉我们,他们并没有与嵌入式闪存结合,如果其中一项新兴技术(如多位ReRAM、PCM或NRAM)作为一种强大的替代技术出现,他们肯定会考虑迁移到这种技术。



IPU


Mythic的芯片被称为IPUs或智能处理单元。在外设方面,该芯片非常简单,由PCIe的x4通道和DNN平铺网格组成,PCIe是负责整个芯片管理的基本控制处理器。由于芯片的设计是为了存储整个模型,没有DRAM。


Mythic表示,由于这是一个基于tiles的设计,如果有需求,他们可以通过添加直接的音频/视频和各种其他接口来进一步定制。在去年的Hot Chip上,Mythic谈论的是一款5000万权值(weights)的初始产品。在最近的人工智能硬件峰会上,Mike Henry表示,初始产品权值将达到1.2亿,这比最初的计划要多很多。在富士通的40nm制程中,近标线全尺寸芯片应具有约300M权值的容量,因此120M仍然是一个相当大的芯片。


IPU的作用是作为一个连接到主机的PCIe加速器。对于大型模型或多个模型,可以使用多个IPU。模型最初被加载到IPU中,并保持静止。没有DRAM和编程闪存相对较慢,因此模型应该能够适应芯片与多个应用映射到同一芯片。这对于许多边缘应用程序来说非常典型。在正常操作下,主机CPU将数据发送到IPU,并通过PCIe端口接收结果。


IPU总体设计(WikiChip)


该芯片由DNN tiles构成网格。在一个tiles里面是一个模拟矩阵乘法器,它建立在一个巨大的嵌入式闪存池的顶部,用来计算权值。嵌入式闪存单元使用浮动栅极通过存储电荷、控制阈值电压来存储位。晶体管支持256级电导(G=1/R)之间的完全关闭和打开状态,Mythic用它来表示8位值。


通过将所有神经元的权值映射到闪光晶体管上,他们可以利用欧姆定律自然地进行矩阵乘法运算。实现的方法是使用闪光晶体管将权值表示为可变电阻。这在计算之前执行一次。使用8位DAC,输入矢量作为一组电压通过可变电阻。根据欧姆定律,输出电流是输入数据与权值向量(I = V x G)相乘的结果。最后,一组adc将产生的电流转换回数字值,成为输出矢量。ReLu和其他各种非线性操作也由adc在那个时间点完成。


围绕这个组件还有一些额外的逻辑。不管工作条件如何,DAC/ADC封装器都会进行补偿和校准,以获得精确的8位计算—类似于今天的图像传感器所做的工作。


模拟矩阵乘法(wikichip)


需要指出的是,这个方案没有实际的内存访问。矩阵相乘是在内存中完成的,利用欧姆定律,所以没有权值访问能量。使用固定权值时,也没有批量大小或其他特殊处理。虽然固定容量可能会带来一些问题。顺便说一下,它们支持神经元稀疏,但不支持权值稀疏性。


有趣的是,Mythic说,对于他们的第一代,为了加快开发和上市时间,他们不会使用DAC作为输入。相反,他们使用一个数字近似电路,由此分别计算每个输入位,然后累加结果。他们将在将来用DAC消除这种情况,这有望为他们提供一些很好的改善。


推荐阅读

史海拾趣

南京国博公司的发展小趣事

国博电子的前身可以追溯到2000年成立的上海华信集成电路有限公司,起初专注于射频芯片的研发与生产。随着技术的积累和市场的拓展,公司逐步从单一的射频芯片企业成长为覆盖射频芯片、模块、组件的完整产业平台。这一跨越不仅体现了公司在技术上的深厚积累,也反映了其对市场需求的敏锐洞察和快速响应能力。通过不断的技术创新和产品研发,国博电子成功在无线通信、移动通信等领域占据了一席之地。

Dicon Fiberoptics Inc公司的发展小趣事

DiCon Fiberoptics Inc公司成立于1986年,当时的光纤通信技术正处于快速发展阶段。公司创始人凭借对行业的敏锐洞察和坚定信念,决定投身于这一领域。在创业初期,公司面临着资金紧张、技术壁垒高等诸多挑战。然而,通过不懈努力和持续创新,DiCon成功研发出了多款高性能的光纤通信产品,逐渐在市场上获得了认可。

GC Electronics公司的发展小趣事
将水位传感器或温度传感器安装在冷却系统的适当位置,确保能够准确监测到水量或水温。
Aavid Niagra公司的发展小趣事

近年来,电子行业正经历着深刻的变革,新兴技术的不断涌现对传统散热技术提出了严峻挑战。Aavid Niagra公司面对这一变革,积极调整战略方向,加大在新兴技术领域的研究力度。通过与高校、研究机构的合作,公司成功研发出了一系列适应新兴技术需求的散热产品,成功应对了行业变革带来的挑战。

AAC [American Accurate Components]公司的发展小趣事

随着业务的不断拓展,AAC公司意识到美国市场的巨大潜力。于是,在1996年,AAC决定在美国设立分公司,专门负责美国市场的销售。与此同时,为了满足不断增长的市场需求,AAC还在深圳设立了美欧电子有限公司,专门批量生产手机用讯响器。这一系列的举措使得AAC的产品线更加丰富,产能也得到了大幅提升。

Emerson公司的发展小趣事

进入20世纪,Emerson迎来了一系列技术突破。1903年,公司成功研发出马力超过1/2的电机,这些电机被广泛应用于洗衣机、缝纫机等家用电器,进一步拓宽了公司的业务范围。此外,Emerson还积极开拓海外市场,通过并购和战略合作,逐步将业务拓展至全球范围。

问答坊 | AI 解惑

FLASH代换升级手册(适用MPN和U盘) (转载)

本帖最后由 jameswangsynnex 于 2015-3-3 19:57 编辑 转自:数码之家 200birds原创 看到一个不错的帖子,与大家分享下: FLASH代换升级在MPN维修和U盘DIY中是经常要用到 的,比如维修MP4的时候怀疑固件问题,想刷FW,但是手上没有确定正确的固件 ...…

查看全部问答>

如何编程实现wince桌面背景更换

高手们,问下一个问题 如何用编程实现wince桌面背景的更换 比如,更换为我指定位置上的那张图片。 以下是我在evc跑的代码 BOOL T=FALSE;         TCHAR bmpfile[]=L\"sdmmc\\\\wince.bmp\";         ...…

查看全部问答>

DSP tms320vc33定时器定时时间?

EXTCLK接11.0592M晶振 XIN接地 CLKMD0和CLKMD1均接高电平。 Timer0.Period = 0x1d4c0; Timer0.Counter = 0x1d4c0;    Timer0.Control = 0x3f2; Timer0多少时间产生了一个中断? Timer0中断中Timer0->Control ^= 0x4 Timer0->Contro ...…

查看全部问答>

关于芯片加密

大家好,我做了个小系统,用AT28C64B 做程序存储器,请问如何给芯片加密,以保护我的程序不被窃取呢?有的编程器可以加密,但是既然可以加密,就应该可以解密,不知哪位高手能给个办法,让我的程序写进去之后就读不出来了,而且还能继续使用,拜托 ...…

查看全部问答>

模态对话框的创建和关闭方法

Wince下,我在Dialog1中创建了一个模态对话框Dialog2。 CDialogTime m_DiaTime; m_DiaTime.DoModal(); 然后在Dialog2中分别使用下面函数,关闭。 用 (1)OnOK(); (2)DestroyWindow(); (3)CDialog::EndDialog(0); 这三个函数都不行。 win ...…

查看全部问答>

S3c2440开发板的底板和核心板原理图

为大家提供方便,需要的可以下载…

查看全部问答>

请教香一主:用了HSI后,我的10B开发板

之前一直用的比较好,没什么异常,自从采用内部HSI后,先是出现USART1工作不正常,然后出现J-LINK没法写入程序,并报如错误:“Wrong AHB ID (15:3).Expected 0x04770001 (Mask 0x0FFFFF0F), Fund 0xFFFFFFFF”。现在J-LINK没办法烧入了这块板 ...…

查看全部问答>

请教I2C总线速率

请问用MSP430的P口仿真I2C总线,使用内部DCO时速率最高能达到多少…

查看全部问答>

JTAG客栈--做中国人自己的JTAG adapter,JTAG不再是神话!

JTAG客栈--做中国人自己的JTAG adapter,JTAG不再是神话!     JTAG 是 JOINT TEST ACTION GROUP的简称。IEEE 1149.1 标准就是由 JTAG这个组织最初提出的,最终由IEEE 批准并且标准化的。所以,这个 IEEE 1149.1 这个标准一般也俗称 JTA ...…

查看全部问答>