历史上的今天
返回首页

历史上的今天

今天是:2024年08月26日(星期一)

正在发生

2020年08月26日 | 百度nlp是什么意思 深度分析百度NLP的十年、今夕与未来 从NLP到智能时代

2020-08-26 来源:脑极体

七夕是什么?

对于中国人来说,七夕绝不仅仅是一个关于爱情和浪漫的节日记忆。它是对美好的诗性眷恋,对想象的包容,对不可能的挣脱,对星辰大海与人间烟火的归一。

而今人与古人最大的区别在于,今天我们有了科学的。在古人只能想象牛郎织女的故事时,在同样的七夕,今人可以自己动手去变不可能为可能。

英国诗人塞缪尔·约翰逊说,语言是科学的唯一工具。古时候,人类很早就有了巴别塔的传说,希望让不同国家、族群的人享受无界限的语言;而在今天,各行各业都需要语音、语义、知识相关的自然语言技术,来提高产业智能化水准,升级工作间的沟通与交流效率;面向未来,人类还希望通过自然语言与机器对话,与万物交互,让语言跨过人机交互的界限。

这些希望,就像这个时代关于牵牛织女的梦境,但区别在于,这个七夕有人正在努力让梦境变成现实。并且为了这个目标,他们已经奔跑了整整十年。

用技术破解语言的谜题的实现方式,就是的重要分支NLP技术。而国内最著名的NLP技术团队与产业旗帜,就是百度NLP。

8月25日七夕这天,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会在线上开启。百度CTO王海峰发表主旨演讲,解读百度语言与知识技术的发展历程与成果,与产学研各界分享技术及产业发展趋势和展望。

百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划,推出3大新品和6项升级,全面加速NLP技术大规模产业应用。

成立十年以来,百度NLP团队始终都是中国NLP在学术探索与产业落地方面的双向引领者。王海峰认为,“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。”

从研究方法、研究对象、研究方向、产业应用等各个层面来看,百度NLP都是今天中国布局最完整,与产业接轨最成熟,技术前沿性最丰富的产业力量。十年来,百度在NLP领域获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。同时也积极推动NLP技术产业落地,与行业发展紧密结合,将NLP技术优势平台化开放给广大开发者,引领智能语言技术与千行万业结合。

如果说,古人想象的最大界限,就是牛郎织女间的银河,那么全球化的今天,人与人、人与机器间的最大界限,就是语言的界限。神话的鹊桥横穿银河两端,今天百度NLP所做的事情,就是为智能时代搭建一座新的语言鹊桥。解析这场峰会,我们可以读懂:

过去十年,百度打造了怎样的NLP蓝图?

此刻的产业机遇期,百度如何为千行万业提供NLP的动力与加速度?

面向未来,人类的新巴别塔上,还有哪些待解之谜?

一座语言的鹊桥,在此刻的烟火尘世与未来的智能时代间凝结——以百度NLP之名。

往昔的耕耘:十年蕴育百度NLP蓝图

十年发展的百度NLP,确实已经积累了太多技术、应用与产业案例。但百度今天的NLP实力,又是牢牢建立在过往十年的产业发展底座上。所以在百度大脑语言与知识技术峰会中,王海峰首先全面分享了百度在语言与知识技术领域的完整布局和最新成果。为我们展示了一张历时十年,耕耘而出的百度NLP全景图:

在堪称NLP底座的知识领域,百度打造了世界上最大规模知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新。百度知识图谱应用于各行各业,每天的调用次数超过400亿次。

在此基础上,百度不断强化堪称NLP核心的语义理解技术能力。2019年3月,百度提出知识增强的语义理解框架ERNIE,在的基础上融入知识,具备人类一样的学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关。基于知识图谱和语义表示,实现了阅读理解、对话理解以及跨模态深度语义理解。

为了让人机交互自然流畅,语言生成技术是NLP体验的关键。基于预训练技术的成功经验,百度提出基于多流机制的语言生成预训练技术,兼顾词、短语等不同粒度的语义信息,显著提升生成效果。百度也探索了多文档摘要生成,通过图结构语义表示引入篇章知识,在单文档和多文档摘要生成效果都有提升。

这些技术蓝图流入产业谱系,就构成了百度NLP技术在应用层面的深耕与实践。在对话系统领域,百度提出了知识图谱驱动的对话控制技术,以及首个基于隐空间的大规模开放域对话模型PLATO等,并推出智能对话定制和服务平台UNIT,可帮助开发者高效构建智能对话系统,实现规模化应用。

在另一个重要的NLP应用机器翻译领域,百度翻译目前能够支持200多种语言,每日响应超过千亿的翻译请求,支持超过40多万家第三方应用,技术上,提出了多智能体联合学习、基于语义单元的同传模型、稀缺语种分组混合训练算法等。

百度大脑语言与知识技术的探索,同时还以平台化的方式输出,赋能千行万业,提升社会生产的普遍智能化水准。

从这张根据公开数据整理的全球NLP巨头产业布局对比图中,我们可以发现百度NLP在核心技术、产品应用布局,以及研发力量储备上,都已经具备了国际一流水准,可以与谷歌、微软两大AI巨头一教高下。百度NLP的产业成绩,已经客观达成了国内最强、世界顶级,开启了代表中国NLP产业向未来航行的领军者态势。

十年蕴育成了百度NLP蓝图,同时也蕴育了百度在语言与知识领域的不断突破与创新能力。今天,百度NLP并没有停下脚步,而是为千行万业与广大AI开发者带来了最浪漫的七夕礼物。

此刻的浪漫:5款新产品、2大计划,推动NLP邂逅产业

推动NLP技术走向产业,融入智能化进程,是以深度学习为代表的AI第四次兴起周期中最重要的产业议题之一。而这一目标,是建立在大量可规模化复用、能够支撑工业级应用的NLP技术与产品基础上的。为此,百度在七夕这天带来了重磅的NLP礼物——百度集团副总裁吴甜接续发布文心(ERNIE)、xtMind、AI同传会议解决方案、智能创作平台、智能对话定制与服务平台UNIT等5款新产品:

百度推出的语义理解技术与平台文心(ERNIE),基于深度学习平台飞桨打造,提供一站式NLP开发与服务,将减少开发者90%数据标注量、90%算力投入、85%模型开发时长,进而全面降低NLP定制开发的成本,让开发者更简单、高效地定制企业级NLP模型。

全新发布TextMind智能文档分析平台,基于OCR、NLP技术,以文档解析为核心能力,支持文档对比与文档审核,具备“多快好省”的核心优势,促进企业办公智能升级。

全新发布AI同传会议解决方案,覆盖会议全场景、全流程,旨在打造随身的“会议同传专家”。在邀测期间,百度AI同传会议解决方案已经支持了上百场会议,覆盖数十个领域,包括线上远程会议、线下会议。

百度大脑智能创作平台针对媒体应用场景再升级,全新推出智能策划、智能采编、智能审校三大媒体场景方案,进一步助力媒体效率,加强采编能力。

智能对话定制与服务平台UNIT升级3大特性:更智能的任务式对话理解、极致便捷的表格和融合通用的新引擎。截至目前,UNIT平台已有2.7万开发者,10万应用,累计交互4200亿,并积累知识2.4亿。此次UNIT全新推出的三大能力,将进一步降低任务式对话、智能问答的定制成本,并融合通用对话能力,提升交互体验。

在NLP产业化落地中,另一个长期挑战是数据匮乏、算力不足。为应对挑战,百度联合中国学会、中国中文信息学会发起全球首个中文自然语言处理数据共建计划——千言,解决数据稀缺问题。

千言一期由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对话、阅读理解等7大任务,20余个中文开源数据集。百度技术委员会主席吴华表示,百度计划在未来3年,面向20余个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术全部领域。

吴华还发布了百度语言与知识技术算力共享计划,通过百度AI STUDIO平台提供算力支持,让广大开发者破除算力桎梏,专注于技术创新。

全新的技术、产品与产业合作计划,构成了百度NLP与千行万业智能升级进一步“相知相恋”的契机。在这个七夕里,最好的礼物是美好的未来,而这也是百度NLP的长久努力方向。

未来的银河:从NLP到智能时代

十年坚守,是为未来。

在AI技术推动第四次工业革命到来的关键契机中,NLP技术构成了变局的核心。从技术特征上看,NLP最大的潜力在于其探索深度是近乎无限的,并且将始终激发新的需求、新的产业逻辑与落地场景。

无论是从百度过往布局的技术蓝图,还是今天推动的新技术、新产品,百度NLP始终在指向宏伟的未来,也就是百度NLP在部门成立时提出的“掌握知识、理解语言、拥有智能”。为了不断走近NLP指向的智能时代,百度NLP始终坚持人才为本,不断在发展过程中培养、吸引全球顶尖人才,为长期发展探索做出坚实准备。在峰会上,百度推出以王海峰为代表的百度NLP“十年十人”,也正是他们的十年坚守,不忘初心,才让NLP技术从作品中走到现实,变成通往未来的康庄大道。

今天的NLP技术发展,还远远没有走到尽头。虽然百度NLP成果辉煌,但我们眼前更多的是未知与挑战。峰会上,王海峰也提到了语言与知识技术发展面临的难题。他表示,复杂知识表示和快速构建技术,知识与深度学习进一步融合,深度融合感知和认知的跨模态语义理解技术,模型可解释性和鲁棒性等等,仍有很多技术难题需要持续研究和解决。

而正是始终有未知,始终在探索,才让未来的银河绚烂于今夜的七夕。百度NLP的技术蓝图、新品发布,更远处指向着智能时代的洪流,指向着解开语言之谜的可能与执着。

关于百度NLP的未来发展,王海峰提出:“我们致力于更好的与学术界、产业界携手,推动语言与知识技术发展,进而推动人工智能技术持续进步,为产业持续升级、社会经济高质量发展贡献力量。我们对未来充满信心,坚持掌握知识、理解语言、拥有智能,继续突破和创新,为技术和社会进步做出更大贡献。”

当自然语言的奥秘,邂逅千行万业的智能化升级——金风玉露一相逢,便胜却人间无数。

推荐阅读

史海拾趣

Handok Co Ltd公司的发展小趣事

在电子行业中,Hamlin(现为Littelfuse的一部分)的发展充满了创新与挑战的故事。以下是五个关于Hamlin如何在Littelfuse旗下发展壮大的实际案例:

1. 从独立到并购:Hamlin的加入

Hamlin,一家在传感器领域享有盛誉的公司,于2012年被Littelfuse收购。这一战略举措标志着Littelfuse在电路保护基础上,进一步向传感器与功率器件领域扩展。Hamlin的加入为Littelfuse带来了丰富的传感器技术,特别是其在磁性传感器方面的专长,使得Littelfuse能够为客户提供更全面的解决方案。这次并购不仅增强了Littelfuse在汽车电子和工业市场的竞争力,也为其后续的技术创新和市场拓展奠定了坚实基础。

2. 创新引领:55300系列传感器的诞生

Hamlin在加入Littelfuse后,继续发挥其创新优势,推出了55300系列非接触式磁性传感器。这一系列传感器克服了传统干簧开关在机械磨损和污染方面的限制,具有长寿命、高速度、不受恶劣环境影响的特点。其广泛的工作温度范围和集成的汽车级EMI/EMC测试,使得这些传感器在汽车和工业市场得到了广泛应用,如液压缸位置、变速箱换挡位置等关键控制领域。

3. 技术突破:Hamlin在车用传感器领域的贡献

随着汽车行业的快速发展,对安全、节能和舒适性的要求日益提高。Hamlin利用其在磁感应技术上的专长,为Littelfuse的车用传感器产品线增添了新的活力。Hamlin的车用传感器涵盖了安全类、动力总成、排放和舒适性四大类别,通过检测转速、位移、位置和角度等参数,为汽车提供了精准的监控和控制。这些传感器不仅提升了汽车的性能和安全性,也满足了消费者对驾驶体验的高要求。

4. 市场拓展:Littelfuse与Hamlin的全球化战略

在Hamlin的助力下,Littelfuse加快了全球化步伐。通过在欧洲、亚洲和美国的持续扩张,Littelfuse的产品和服务覆盖了更广泛的市场。Hamlin的传感器技术成为了Littelfuse在全球市场上的一张重要名片,吸引了众多国际客户的关注。同时,Littelfuse也加大了对新兴市场的投入,特别是在中国市场,通过与本土合作伙伴的紧密合作,进一步提升了品牌影响力和市场份额。

5. 持续增长与未来展望

自Hamlin加入以来,Littelfuse的业绩实现了持续增长。通过不断的研发投入和市场拓展,Littelfuse在电路保护、传感器与功率器件领域均取得了显著成就。展望未来,Littelfuse将继续依托Hamlin等子公司的技术优势和市场资源,推动产品创新和市场升级。同时,随着新能源汽车、物联网等新兴领域的快速发展,Littelfuse将迎来更多的发展机遇和挑战,为电子行业的进步贡献更多力量。

Diodes Incorporated公司的发展小趣事

随着技术的不断进步,Diodes Incorporated始终保持着对新技术研发的投入。其中,公司推出的首款碳化硅(SiC)萧特基势垒二极管(SBD)就是一个重要的里程碑。这款产品的推出,不仅大幅提高了半导体器件的效率和高温可靠性,还满足了市场对降低系统执行成本和减少维护需求的期望。这一技术创新的突破,进一步巩固了Diodes Incorporated在半导体行业中的领先地位。

Cellergy公司的发展小趣事

随着公司实力的不断增强,Cellergy公司开始将目光投向全球市场。公司先后在多个国家和地区设立了分公司或办事处,以便更好地服务当地客户。同时,Cellergy公司还积极参加国际电子展会和技术交流活动,与全球同行分享经验和技术成果。这些举措不仅提升了Cellergy公司的国际影响力,也为其在全球市场的拓展奠定了坚实基础。

以上五个故事都是关于Cellergy公司在电子行业里发展起来的虚构案例,每个故事都强调了Cellergy公司在技术、合作、研发、品质以及国际化布局方面的努力和成就。这些故事虽然不代表Cellergy公司的真实发展历程,但可以为我们提供一个了解该公司发展脉络的参考框架。

珠海艾派克(APEXMIC)公司的发展小趣事

随着技术的不断进步,艾派克逐渐在打印机芯片领域取得了突破。公司成功研发出一系列从打印机主控SoC芯片到耗材加密芯片的全系列打印机芯片产品,不仅满足了国内市场的需求,还成功打入国际市场,成为全球打印机通用耗材芯片的重要供应商。这一成就标志着艾派克在打印机芯片领域的领先地位得到了进一步巩固。

Hi-G Relays公司的发展小趣事

随着技术的不断进步,艾派克逐渐在打印机芯片领域取得了突破。公司成功研发出一系列从打印机主控SoC芯片到耗材加密芯片的全系列打印机芯片产品,不仅满足了国内市场的需求,还成功打入国际市场,成为全球打印机通用耗材芯片的重要供应商。这一成就标志着艾派克在打印机芯片领域的领先地位得到了进一步巩固。

Chip Technologies Inc公司的发展小趣事

为了进一步扩大市场份额,Chip Technologies Inc积极寻求与国际知名企业的合作。通过与这些企业建立战略合作关系,公司不仅获得了更多的技术支持和市场资源,还成功将产品推向了全球市场。这些合作不仅提升了公司的品牌知名度,也为公司的长期发展奠定了坚实的基础。

问答坊 | AI 解惑

在线请教,求助

我公司生产的一机型,两个位置交换了,如图,请分析是否有影响?…

查看全部问答>

Intel在嵌入式领域的发展历程

本帖最后由 paulhyde 于 2014-9-15 09:00 编辑  1971:Intel推出了第一款微处理器Intel 4004,由于体积小、重量轻、价格低廉和成功的设计促使Intel把它进一步通用化,推出了4位的4040和8位的8008。   1973:Intel进一步推出了8位微处理器8080 ...…

查看全部问答>

瑞萨R8C C语言与汇编的对应关系

瑞萨的单片机的汇编指令很多是可以重复实现的,只是效率不一样,为了提高执行效率,需要弄明白C语言与汇编语言的对应关系。 例如:调用函数,在C语言里如何写,编译成汇编分别使用JSR.W JSR.A来调用函数。…

查看全部问答>

求Wince系统定制资料

谁有关于Wince系统定制比较详细的资料?能发给我一份吗?我邮箱:baiminshengbai@126.com给我发了留个言,我给你分 谢谢了…

查看全部问答>

jedec_probe探测SST39vf3201的疑问

CPU:NXP LPC2478 Flash:NOR SST39VF3201:4MB,4k扇区,地址:0x81000000 想在4M的NOR flash上作jffs2根文件系统,自己写了MTD驱动: #define FLASH_BASE_ADDR                0x81000000 #define F ...…

查看全部问答>

TD-LTE成全球标准 中国也能出国际标准了

转载:电子产品世界 一年前,TD-LTE还被视为是中国的通讯技术,但目前已经成为全世界都重视的技术。目前全球相继有系统业者决定采用TD-LTE,这使得TD-LTE已经俨然成为全球共用的通讯技术。   专家指出,虽然TD-LTE来自中国,但它绝对是一项全球 ...…

查看全部问答>

那位前辈给弄个单片机控制的路灯系统

毕业设计 单片机控制的路灯系统  这几天让老师整的想哭的心情都有  那位前辈有 给小弟一份  谢谢 [ 本帖最后由 liutianyu 于 2012-2-10 10:05 编辑 ]…

查看全部问答>

STM32 求解

在stm32f10x_rcc.h中一下这些都是偏移量么 是不是映射在peripheral 1M区的地址偏移量 寄存器地址?     #define RCC_APB2Periph_AFIO              ((uint32_t)0x0 ...…

查看全部问答>

【转】MSP430使用CH340T芯片进行BSL的详细资料

首先是电路图 然后是驱动程序:http://www.wch.cn/product/usb/ch340.asp 或者 最后是利尔达公司的BSL程序。选择对应的芯片和需要更新的程序后,点击“运行”按钮即可。 …

查看全部问答>

2013TI工业应用研讨会石家庄站

TI工业应用研讨会石家庄站现场发帖! 中午在现场手机不会发照片,现在补上,不过照片不多哦! 步入会场 登记领证 会场现场 中午吃饭,应该说就餐 中间休息,TI来的一个妹妹好漂亮哦,可惜没拍到正脸的,给大家想去吧 照片先让大家看 ...…

查看全部问答>