用友采用第五代英特尔® 至强® 可扩展处理器加速自然语言处理 (NLP) 应用助力企业服务数智化转型

2024-05-17

阅读数：

“

“我们一直致力于推动NLP等技术在企业服务流程的广泛应用，使得企业服务由流程驱动转变为基于AI模型调度的语义驱动。在此过程中，高性能的第五代英特尔 ^® 至强 ^® 可扩展处理器能帮助我们加速AI应用，进而为企业带来智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成，契合企业基于数智技术实现业务与业务、业务与财务、业务与管理融合创新的时代需求。”

—— 方高林

用友助理总裁

”

“

“我们正在迈向以AI广泛应用为突出标志的数智化时代，第五代英特尔 ^® 至强 ^® 可扩展处理器将为用户的数智化转型战略提供坚实的算力基础。与用友的合作证明，该处理器在向量化操作、AI加速等方面有着卓越的性能优势，且具备出色的灵活性与经济性，可助力打造数智化的企业服务体系。”

—— 唐炯

英特尔（中国）有限公司

软件技术合作事业部总经理

”

挑战

自然语言处理 (NLP) 应用常会涉及到向量化处理，这在满足数据匹配、特征检索等应用要求的同时，也给基础设施平台带来了以下挑战：

海量的向量化数据处理会导致吞吐性能出现瓶颈，随着NLP应用规模的扩大，需要进行向量化处理的数据在不断增长，带来了与日俱增的性能压力。

在如今的NLP应用中，词嵌入 (Word Embedding) 等技术实现了深度应用，这些技术依赖于向量映射等操作，对于向量性能带来了较高要求。

出于经济性考量，用户通常希望能够尽可能提升向量化处理的性能密度，对于基础设施的总体拥有成本 (TCO) 进行更好的控制。

解决方案概述

作为人工智能(AI)技术的一个重要发展方向，自然语言处理(NLP) 在近年来实现了高速发展，并被普遍应用于虚拟个人助理 (VPA)、智能搜索、智能语音助手、知识问答等领域，为用户提供了更加贴近自然语言表达方式的人机交互服务，增强业务的智能化并提升处理效率。随着接入NLP服务的应用、用户数量的快速增长，以及NLP模型复杂度的不断提升，NLP面临着日益沉重的性能挑战，这包括NLP中的向量化处理要求较高的吞吐能力。

为了提升NLP应用的处理性能，用友在全新一代商业创新平台 (BIP) 的支撑底座：iuap中，采用了第五代英特尔 ^® 至强 ^® 可扩展处理器进行加速。第五代英特尔 ^® 至强 ^® 可扩展处理器实现了显著的代际性能提升，并可利用英特尔 ^® AVX-512 指令集的支持，大大提升了向量指令的吞吐能力，能够更好地应对庞大的向量数据操作量带来的性能压力，助力构建更加高效的企业智能中台，赋能智友对话机器人、智能大搜等应用。

用友 iuap 通过 NLP 技术 赋能企业数智化 转型

用友商业创新平台YonBIP是用友采用新一代信息技术，按照云原生（含微服务）、元数据驱动、中台化和数用分离的架构设计，涵盖平台服务、应用服务、业务服务与数据服务等形态，集工具、能力和资源服务为一体，服务企业与产业商业创新的平台型、生态化的云服务群。YonBIP具有数字化、智能化、高弹性、安全可信、平台化、生态化、全球化和社会化八大特性，是企业通过数智化实现商业创新发展的使能平台。

iuap作为全新一代商业创新平台的支撑底座，服务于成长型、大型及巨型企业数智化转型，助力企业提升数字化技术驾驭能力。其基于技术平台、数据中台、智能中台及业务中台，为企业提供了中台化构建能力、多云环境下的混合云开放集成互联互通能力、技术普惠化下的低代码开发和数智能力自助等应用快速构建能力。iuap智能中台是企业数智化大脑，通过AI平台+算法+知识图谱技术，以统一的智能交互方式和智能服务，提升核心竞争力，为客户创造价值，降本增效。其产品主要包含数智员工、RPA、智友、智能搜索、知识图谱、AI工作坊、智能服务等。

图 1. iuap智能中台总体架构

iuap智能中台在智友对话机器人、智能大搜等应用中深度采用了NLP技术：

智友对话机器人

智友对话机器人是AI+互联网时代，人工智能应用的核心入口，通过运用语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)等技术，将语音等非结构化的数据，转变为机器可处理的结构化数据，与现有的OA，CRM，ERP等应用系统相结合，成为用户的智能虚拟助理，为用户提供问答与任务执行服务。智友对话机器人依托于用友IUAP云平台，结合协同、采购、人力等领域特性，通过意图、知识库、技能、对话标注等的综合运用，构成机器人创建、训练、反馈、优化的闭环使用场景。典型的对话机器人应用有以下几种：

0 1

知识问答： 对用户意图进行解析，基于预置业务知识库，进行业务问题进行解答。

0 2

业务处理： 对接相关业务系统，将语音指令，转换为机器人能够理解的结构化指令，并结合后台业务系统，完成相应操作。

0 3

闲聊： 回答用户的一些问候、情感及娱乐信息等开放性问题。

智能大搜

智能大搜是用友云智能搜索服务的一个核心应用，应用场景包括智能搜索、知识问答、图谱协作、员工赋能等，提供搜文档/图片/视频/课程、AI问答搜、图谱搜索/推理、智能问答、AI导读与推荐等功能（见图2），可以帮助企业快速构建基于领域/行业多模态知识的检索及问询系统，支持海量级结构化/非结构化数据存储，提供智能问答（知识、文档、图片问答等）、资源检索、智能推荐等服务。

图2. 用友智能大搜应用场景

在上述产品中，用友在任务型对话（包括槽位识别、意图理解、指代消歧、实体识别等）以及搜索、问答（包括检索增强、Query分析、关键词/摘要抽取、关键词召回、向量召回、语义相关性、多级排序、关联推荐等）中采用了NLP技术，并在搜索问答场景中的多类型资源召回，任务型对话中的意图/触发语句识别、以及其他语义相关性计算场景中进行了向量化处理。

采用第五代 英特尔 ^® 至强 ^® 可扩展处理器加速 NLP 向量化处理

向量化是一种并行计算技术，该技术能够根据一定的规则，将多个数据组合为单一的向量，成为一组属性的集合，有助于提高程序的执行效率，也能够用于描述特定目标的不同特征属性，是AI等应用的重要基础数据。在NLP应用中，有大量的流程都需要进行向量化处理。

向量化在词嵌入等技术中得到广泛应用。词嵌入是NLP中的一种表示技术，它将词语或短语从词汇表映射到向量的实数空间中，通过训练模型，使其学会预测一个词在给定上下文中的出现概率，从而得到这个词的向量表示，词义的语义信息就能以数值的形式表达出来。在用友NLP业务的向量化处理中，其会根据不同任务进行模型结构优化和策略设计，采用企业内部数据/行业数据进行预训练及监督微调，随后进行模型加速、性能优化。

向量数据是NLP应用重要的基础数据，由于NLP业务规模的快速增长，目前平台的特征向量规模可能会达到亿级别，这对于向量数据的吞吐能力提出了苛刻要求。

第五代英特尔 ^® 至强 ^® 可扩展处理器有助于改善向量的吞吐性能。第五代英特尔 ^® 至强 ^® 可扩展处理器拥有更可靠的性能，更出色的能效。它在运行各种工作负载时均可实现显著的每瓦性能增益，在AI、数据中心、网络和科学计算的性能和总体拥有成本(TCO)方面亦有更出色的表现。相较上一代产品，第五代英特尔 ^® 至强 ^® 可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存。此外，它与上一代产品的软件和平台兼容，因此部署新系统时可大大减少测试和验证工作。

图3. 第五代英特尔 ^® 至强 ^® 可扩展处理器具备强大性能

用友的测试数据如图4所示，相较于第四代英特尔 ^® 至强 ^® 可扩展处理器，第五代英特尔 ^® 至强 ^® 可扩展处理器在NLP (YonMaster Dialogue Bot) 工作负载中实现了1.2 倍的代际吞吐性能提升 ⁶ 。

图4. 用友NLP 应用在基于不同代英特尔 ^® 至强 ^® 可扩展处理器上的

吞吐性能比较

收益

提升NLP应用的性能，显著化解NLP中频繁的向量化操作所带来的吞吐性能挑战，从而助力上层的智友对话机器人、智能大搜等应用的高效运行。

提升了服务器的单位性能密度，在同等性能的水平下，降低了服务器规模的扩展需求，有助于降低TCO。

该应用实践为用友YonBIP用户的硬件选型提供参考，用户可以根据实际的性能需求，选择更适用的硬件配置。

展望

在第五代英特尔 ^® 至强 ^® 可扩展处理器的支撑下，用友iuap智能中台提升了NLP应用的向量吞吐性能，支撑了整体平台的优化升级。面向未来的发展需求，用友还将在任务型对话中进行意图槽位识别算法升级、Query改写模型与大型语言模型(LLM)结合；在搜索问答上持续优化检索增强(RAG)技术，开展垂域微调、多模态问答等。用友还将与英特尔进行进一步合作，推动NLP的性能优化、模型加速。

面向新一轮商业创新的大潮，用友与英特尔将聚合企业服务生态圈，为客户提供基于新一代数智技术、真正云原生技术架构、创新应用架构的平台和应用服务，提供随需而用的企业云服务和无处不在的数智价值，助力企业实现业务运营和管理的数智化升级与转型。

更多与第五代英特尔 ^® 至强 ^® 可扩展处理器有关的内容，欢迎点击“ 阅读原文 ”了解

1 与第四代英特尔 ^® 至强 ^® 处理器相比的平均性能提升，以 SPEC CPU rate 、 STREAM Triad 和 LINPACK 的几何平均值为衡量标准。请参阅 intel.com/processorclaims 上的 [G1] ：第五代英特尔 ^® 至强 ^® 可扩展处理器。结果可能有所差异。

2 与第四代英特尔 ^® 至强 ^® 处理器相比，取得 1.19 倍到 1.42 倍的性能提升（ ResNet50v1.5 、 BERT-Large 、 SSD-ResNet34 、 RNN-T （仅 BF16 ）、 Resnext101 32x16d 、 MaskRCNN （仅 BF16 ）、 DistilBERT ）。请参阅 intel.com/processorclaims 上的 [A15-A16] ：第五代英特尔 ^® 至强 ^® 可扩展处理器。结果可能有所差异。

3 请参阅 intel.com/processorclaims 上的 [G12] ：第五代英特尔 ^® 至强 ^® 可扩展处理器。结果可能有所差异。

4 请参阅 intel.com/processorclaims 上的 [G11] ：第五代英特尔 ^® 至强 ^® 可扩展处理器。结果可能有所差异。

5 使用内置加速器在 AI 、数据和网络工作负载上进行测量，取得 1.46 到 10.6 倍的每瓦性能提升。请参阅 intel.com/processorclaims 上的 [A19-A25] 、 [D1] 、 [D2] 、 [D5] 和 [N16] ：第五代英特尔 ^® 至强 ^® 可扩展处理器。结果可能有所差异。

6 用友截止至 2023 年 11 月的内部测试结果。测试配置：基准配置 — 双路英特尔 ^® 至强 ^® 铂金 8480+ 处理器 @ 2.0GHz ， 1024GB 总内存 (16x64GB DDR5 4800MT/s) ， Ubuntu 22.04.3 LTS ；新配置 — 双路英特尔 ^® 至强 ^® 铂金 8592+ 处理器 @ 1.90GHz ， 512GB 总内存 (16x32GB DDR5 5600 MT/s) ， Ubuntu 22.04.3 LTS 。英特尔并不控制或审计第三方数据。请您审查该内容，咨询其他来源，并确认提及数据是否准确。