爱芯通元NPU完成Llama 3和Phi-3大模型适配,推动AI大模型技术应用普及
2024-04-28 来源:EEWORLD
中国 2024年04月28日——人工智能芯片研发及基础算力平台公司爱芯元智宣布,近日,Meta、Microsoft相继发布具有里程碑意义的Llama 3系列和Phi-3系列模型。为了进一步给开发者提供更多尝鲜,爱芯元智的NPU工具链团队迅速响应,已基于AX650N平台完成 Llama 3 8B和Phi-3-mini模型适配。
Llama 3
上周五,Meta发布了Meta Llama 3系列语言模型(LLM),具体包括一个8B模型和一个70B模型在测试基准中,Llama 3模型的表现相当出色,在实用性和安全性评估中,与那些市面上流行的闭源模型不相上下。

在架构层面,Llama 3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3使用了超过15T的公开数据进行训练,其中5%为非英文数据,涵盖30多种语言,训练数据量是前代Llama 2的七倍。
根据Meta的测试结果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B模型则超越了名声在外的闭源模型Claude 3的中间版本Sonnet,和谷歌的Gemini Pro 1.5相比三胜两负。

实际上板结果:目前AX650N已经完成了Llama 3 8B Int8版本的适配,若采用Int4量化,每秒token数还能再翻一倍,能满足正常的人机交流。
Phi-3
Llama 3刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。
本周二,微软发布了自研小尺寸模型Phi-3。尽管Phi-3-mini被优化至可部署在手机上,但它的性能可以与Mixtral 8x7B和GPT-3.5等模型相媲美。微软表示,该创新主要在于用了质量更好的训练数据集。


实际上板结果:目前AX650N已经完成了Phi-3-mini Int8版本的适配,已能满足正常的人机交流。
其他成果
AX650N能第一时间完成Llama 3和Phi-3的适配,源于今年以来相关团队悄悄完成了现有NPU工具链针对大语言模型的支持和调优。目前除了Llama 3之外,已经完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等国内外主流的开源大语言模型适配。
相关成果已释放到开发者社区欢迎尝鲜。
后续计划
今年是AIPC的元年,爱芯元智将针对AIPC的常见应用提供更多的解决方案。充分发挥爱芯通元NPU高能效比的技术优势,让各种有趣的大模型实现高性价本地化部署,做到“人人都用得起大模型”,深入实践“普惠AI,造就美好生活”。
- 2024 WAIC智能芯片及多模态大模型论坛丨爱芯通元AI处理器助力打造普惠智能
- 爱芯元智正式公布混合精度NPU中文名称“爱芯通元®”
- Ceva NeuPro-Nano NPU 在 2026 年嵌入式世界大会上 荣获人工智能奖
- 恩智浦发布全新i.MX 93W,融合边缘计算与安全无线连接,加速物理AI部署
- ST首款内置NPU的汽车MCU面世,边缘AI正在重塑汽车电气化
- Ceva 人工智能授权和物理人工智能应用于2025 年 取得突破性进展
- 意法半导体发布汽车AI MCU 首次集成NPU和自研PCM
- RK3576 NPU方案的正确使用指南
- 看过来,RK3576开发板NPU方案你用对了吗?
- Ceva 添加 Sensory 的 TrulyHandsfree 语音激活功能, 增强 NeuPro-Nano NPU 生态系统
- 中兴发布全球首款 Al + Wi-Fi 8 室内 CPE 及全球首款毫米波室外 5G-A CPE
- MediaTek 于 MWC 2026 展示 AI 与通信优势
- 国内首款国产InfiniBand,有什么技术关键点值得关注?
- 恩智浦MCX W72已量产,助力开发安全精准的测距应用
- 全球首个无线网络智能体落地 40万个5G基站焕新
- Gartner预测,到 2030 年,中国 80%的本地 AI 基础设施将采用本土研发的AI芯片
- Gartner发布2026年数据和分析重要预测
- MWC巴塞罗那2026:从基础到新服务,打造AI原生的6G原型
- 首款国产InfiniBand面世,实测数据告诉你性能究竟有多强悍
- 深耕智能5G,从容迈向6G:英特尔以可灵活部署 AI的网络架构,擘画产业未来
- 第三代酷睿Ultra助力商用PC大焕新,英特尔发布全新商用产品组合
- Molex 莫仕推出 145 GHz Cardinal 多端口高频同轴组件, 为 AI 和 6G 测试树立新标杆
- 拿下L3平台定点,纯固态激光雷达即将大规模交付
- 业界独家!英特尔推出革新性IBOT技术,进一步释放x86处理器性能
- 是德科技推出220GHz光波器件分析仪,支持验证新一代光收发器
- Gartner发布三大AI价值实现路径
- Intel 18A新机上市,英特尔转型跃上新台阶
- 兼顾隐私、响应与成本,基于酷睿Ultra的混合AI部署成为智能体新标配
- 别只盯着OpenClaw的Agent!它丝滑的背后,是一场硬件设计的极限挑战




