IBM 推出新型 Spyre 加速器,应用于生成式与代理式AI工作负载
2025-10-11 来源:eenews
IBM 近日发布了全新的 Spyre 加速器,这是一款定制化 AI 芯片,旨在提升企业系统中生成式 AI 和代理式 AI 工作负载的性能。该加速器将于 10 月 28 日在 IBM z17 和 LinuxONE 5 系统上正式商用,12 月起将支持 Power11 服务器。
Spyre 标志着大型主机的可靠性与前沿 AI 加速能力之间建立了实质性桥梁,也为 AI 处理如何更贴近核心业务工作负载提供了思路。
架起 AI 与关键任务工作负载的桥梁
Spyre 加速器的开发目标是为与传统企业应用并行运行的 AI 代理提供低延迟推理和实时响应能力。该芯片采用 5nm 工艺制造,集成 32 个加速核心和 256 亿个晶体管,在实现高吞吐量的同时,仍能保持企业级的安全性和能源效率。
IBM 表示,客户可在 IBM Z 或 LinuxONE 系统中集群部署最多 48 张 Spyre 加速卡,或在 Power11 服务器中部署 16 张,从而在本地提供可扩展的 AI 性能。IBM 指出,这种本地部署方式使客户能够在运行大规模生成式和代理式 AI 工作负载的同时,确保敏感数据的安全。
IBM 基础设施首席运营官兼 IBM 系统总经理巴里・贝克(Barry Baker)表示:“我们的核心优先事项之一是推进基础设施升级,以满足新兴 AI 工作负载的需求。借助 Spyre 加速器,我们正在扩展系统能力,以支持多模态 AI—— 包括生成式和代理式 AI。这一创新使客户能够以无可妥协的安全性、弹性和效率扩展其支持 AI 的关键任务工作负载,同时释放企业数据的价值。”
从研发到商业化的历程
Spyre 的起源可追溯至 IBM 研究院 AI 硬件中心,其最初是作为探索节能 AI 计算的原型而设计。经过多个开发周期和合作(包括与纽约州立大学奥尔巴尼分校新兴人工智能系统中心的合作),该芯片已演进为适用于企业环境的量产级系统级芯片(SoC)。
IBM 半导体总经理兼混合云副总裁Mukesh Khar表示:“我们于 2019 年成立 IBM 研究院 AI 硬件中心,目标是满足 AI 不断增长的计算需求 —— 甚至早于最近 LLM 和 AI 模型的爆发式发展。如今,在先进 AI 能力需求日益增长的背景下,我们很自豪地看到该中心的首款芯片进入商业化阶段。”
让企业 AI 更贴近数据
对于大型主机用户,Spyre 与 IBM 的 Telum II 处理器形成互补,为欺诈检测、零售自动化和预测分析等应用提供近实时推理能力。在 IBM Power 系统上,Spyre 与 AI 服务目录集成,支持一键安装企业 AI 工作流,为大规模生成式 AI 提供无缝的数据转换和集成能力。
随着 Spyre 的推出,IBM 正将自身定位为 AI 加速与企业基础设施的交汇点,这标志着一个重要转变:生成式 AI 不再仅存在于云端,而是越来越多地融入本地系统的核心 —— 这些系统正是关键业务数据的存储之地。
- IBM 推出 Power11 处理器及服务器,宣称系统维护 0 计划性停机
- Deca和IBM联手在北美建立MFIT制造基地
- IBM、Deca 宣布联手,将在加拿大魁北克建设一条先进封装量产线
- 关闭中国研发中心后:IBM美国开启大裁员 工作岗位都将转移到印度
- Rapidus 与 IBM 合作在美制造 2nm GAA 原型晶圆亮相,在日试产 4 月启动
- IBM、格芯化干戈为玉帛,达成和解、将共谋半导体未来发展
- IBM发布全新光电共封装工艺:AI模型训练速度将提升5倍
- IBM 全新光学技术可缩短 GPU 闲置时间,大幅加快 AI 模型训练速度
- 生成式AI新助力:IBM 携手 AMD 明年部署推出 MI300X 加速器服务




