历史上的今天
返回首页

历史上的今天

今天是:2024年12月28日(星期六)

2018年12月28日 | 人工智能真的可以取代同传翻译?

2018-12-28 来源:苏宁金融研究院

前阵子,一位同传翻译员声讨科大讯飞“AI同传造假”,在网上引起了轩然大波。人工智能和同传翻译由此成为大家热议的话题。今天,我们来谈一谈“人工智能翻译是否真的可以取代同传翻译员”?

同声传译有多难?

同声传译最早出现在一战后的巴黎和会上,英法两国代表借助同声传译人员的帮助,完成了紧张的谈判。

如今,该技术依然在国际会议上扮演着极其重要的角色。据统计,95%的国际会议都有专业同声传译人员助力。

同传翻译员在台上能够将同传能力运用自如,需要平时大量的艰苦练习,即使是双语运用自如的专业人员,在实战之前,也要进行数年的锻炼。他们不仅需要事先学习、熟悉会议资料,还需要随机应变的能力。同声传译的工作方式也比较特殊,因为压力巨大,一般多人协同,在一场数小时的过程中,每人轮流翻译几十分钟。

相较之下,普通的口译工作则要简单不少。机器翻译如能代替同声传译无疑具有巨大的价值。

人工智能翻译的水平如何?

那么,人工智能同传翻译的能力究竟怎样?会不会抢走同传翻译员的饭碗呢?

今年上半年的博鳌亚洲论坛上,首次出现了AI同传。然而,现场配备的系统却掉了链子,闹出词汇翻译不准确、重复等低级错误。

客观来讲,人工智能或机器翻译技术在自然语言处理上,的确有许多突破。这些突破给人希望,让人畅想未来,但是,短期内的价值,更多体现在辅助翻译等领域。

当然,目前机器翻译已经取得非常大的进步,在衣食住行等常用生活用语上的中英翻译可以达到大学六级的水平,能够帮助人们在一些场景处理语言交流的问题,但距离人工同传以及高水平翻译所讲究的“信、达、雅”,还存在很大的差距。

目前的差距是由现有技术水平的限制决定的,机器翻译,又称为自动翻译,是利用计算机将一种语言转换为另一种语言,机器翻译技术的发展与计算机技术、信息论、语言学等学科的发展紧密相关。从早期的词典匹配,到结合语言学专家梳理的知识规则,再到基于语料库的统计学方法,随着计算能力的提升和多语言信息的积累,机器翻译技术开始在一些场景中提供便捷的翻译服务。

新世纪以来,随着互联网的普及,互联网公司纷纷成立机器翻译研究组,研发了基于互联网大数据的机器翻译系统,从而使机器翻译真正走向实用,市场上开始出现比较成熟的自动翻译产品。近年来,随着深度学习的进展,机器翻译技术得到了进一步的发展,促进了翻译质量的提升,使得翻译更加地道、流畅。

机器翻译的难点在哪里?

这里,简单介绍一下机器翻译的难点。整个机器翻译的过程,可以分为语音识别转换、自然语言分析、译文转换和译文生成等阶段。在此,以比较典型的、基于规则的机器同传翻译为例(参见下图),模块包含了:语音识别(语音转换为文本)、自然语言处理(语法分析、语义分析)、译文转换、译文生成和语音生成等模块。其中的技术难点主要是:语音识别、自然语言处理和译文转换等步骤。

第一个技术难点是语音识别。近二十年来,语音识别技术取得了显著进步,开始进入家电、汽车、医疗、家庭服务等各个领域。常见的应用系统有:

语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;

语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;

智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、旅行社服务系统、订票系统、银行服务等。

可以说,语音识别技术与其他自然语言处理技术相结合,可以构建出很多复杂的应用。

然而,语音识别的主要难点就是对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。由于语音信息量大,语音模式不仅对不同的说话人不同,对不同场景的同一说话人也是有差异的。

例如,一个人在随意说话和认真说话时的语音特征是不同的。另外,说话者在讲话时,不同的词可能听起来是相似的,这也是常见现象。单个字母或词、字的语音特性,受上下文的影响,以致改变了重音、音调、音量和发音速度等。最后,环境噪声和干扰对语音识别也有较大影响,致使识别率低。

第二个技术难点是语义解析,这是智能化的机器翻译系统的核心部分。目前,机器翻译系统可划分为基于规则和基于语料库两大类。前者以词典和语言知识规则库为基础;后者由经过划分并具有标注的语料库构成知识源,以统计学的算法为主。

机译系统是随着语料库语言学的兴起而发展起来的。目前,世界上绝大多数机译系统都采用以规则库为基础的策略,一般分为语法型、语义型、知识型和智能型。不同类型的机译系统,由不同的成分构成。抽象地说,所有机译系统的处理过程都包括以下步骤:对源语言的分析或理解,在语言的语法、语义和语用等平面进行转换,按目标语言结构规则生成目标语言。

当前,Google 的在线翻译已经为人熟知,其第一代的技术即为基于统计的机器翻译方法,基本原理是通过收集大量的双语网页作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。

不过,采用该技术目前仍无法达到令人满意的效果,经常闹出各种翻译笑话。因为,基于统计的方法,需要建立大规模的双语语料库,而翻译模型、语言模型参数的准确性直接依赖于语料的规模及质量,翻译质量直接取决于模型的质量和语料库的覆盖面。

除了上述传统的方式,2013年以来,随着深度学习的研究取得较大进展,基于人工神经网络的机器翻译逐渐兴起。就当前而言,广泛应用于机器翻译的是长短时记忆循环神经网络。该模型擅长对自然语言建模,把任意长度的句子转化为特定维度的浮点数向量,同时“记住”句子中比较重要的单词,让“记忆”保存比较长的会话时间。该模型较好地解决了自然语言句子向量化的难题。

其技术核心是通过多层神经网络,自动从语料库中学习知识。一种语言的句子被向量化之后,在网络中层层传递,经过多层复杂的传导运算,生成译文。这种翻译方法最大的优势在于译文流畅,更加符合语法规范。相比之前的翻译技术,质量有较高的提升。

智能同传翻译离我们还有多远?

需要说明的是,很多人对机器翻译有误解,认为机器翻译偏差大。其实,机器翻译运用语言学知识,自动识别语法,模拟语义理解,进行对应翻译,因语法、语义、语用的复杂性,出现错误是难免的。就已有的成果来看,全场景通用的机器翻译,其翻译质量离终极目标仍相差甚远。

随着全球化网络时代的到来,语言障碍已经成为二十一世纪社会发展的重要瓶颈,实现任意时间、任意地点、任意语言的无障碍自由沟通是人类追求的一个梦想。这仅是全球化背景下的一个小缩影。在社会快速发展的进程中,机器翻译将扮演越来越重要的角色。

来源:苏宁财富资讯;作者:苏宁金融研究院金融科技研究中心副主任 沈春泽

推荐阅读

史海拾趣

国芯佳品公司的发展小趣事

机顶盒,全称为数字视频变换盒,是现代家庭娱乐中不可或缺的重要设备。它作为连接电视机与外部信号源的桥梁,不仅承担着接收数字电视信号并将其转换为适合电视播放格式的基本任务,还通过技术的不断演进,极大丰富了用户的视听体验。

从专业角度来看,机顶盒经历了从模拟到数字的飞跃,涵盖了多种类型,如DVB-S(数字卫星机顶盒)、DVB-C(有线电视数字机顶盒)、IPTV机顶盒等。这些机顶盒通过不同的传输介质(如有线电缆、卫星天线、宽带网络)接收信号,并借助内部高效的解码器,将数字信号转换成高质量的音视频流,实现了高清乃至4K超高清的播放效果。

在科普层面,机顶盒的普及极大地推动了家庭娱乐的多元化。它不仅让用户能够收看更多样化的电视节目,还能通过连接互联网,提供电子节目指南、在线视频、网页浏览、社交媒体互动等增值服务。此外,一些先进的机顶盒还集成了智能语音助手、家庭影院功能,甚至支持存储个人媒体文件,让用户的娱乐体验更加个性化、便捷化。

随着5G、云计算、人工智能等技术的不断发展,机顶盒正朝着更高清、更智能、更互动的方向迈进。它不仅将继续作为电视内容的接收和展示终端,更将成为智能家居生态系统中的重要一环,为用户带来更加丰富、沉浸的娱乐享受。

ACL staticide公司的发展小趣事

ACL Staticide是一家专业生产静电控制产品的公司,以下是该公司发展的五个相关故事:

  1. 公司成立和起步阶段: ACL Staticide成立于1971年,总部位于美国伊利诺伊州,是一家专注于静电控制产品的制造商。公司最初致力于研发和生产静电消除剂、清洁剂和防静电地板涂层等产品,用于解决静电问题带来的种种困扰,如静电放电、静电积聚等。

  2. 技术创新和产品拓展: 随着市场对静电控制需求的增长,ACL Staticide不断进行技术创新,并拓展了产品线。公司推出了一系列静电控制产品,包括静电消除器、清洁剂、防静电地板涂层、静电测试仪器等,以满足各种不同行业的需求。

  3. 市场拓展和国际合作: ACL Staticide积极开拓国内外市场,与全球各地的客户建立了合作关系。公司的产品被广泛应用于电子制造、半导体、医疗、航空航天、汽车等领域,赢得了客户的信赖。同时,ACL Staticide与国际知名企业合作,共同推动静电控制技术的发展。

  4. 持续投入研发和质量控制: ACL Staticide不断加大研发投入,致力于产品质量和技术创新。公司设立了专门的研发团队和实验室,不断改进现有产品,并开发新的静电控制解决方案,以满足客户不断变化的需求。

  5. 未来发展展望: ACL Staticide将继续致力于静电控制产品的研发和应用,不断推出更先进、更可靠的产品和解决方案,以满足客户在各个领域的需求。公司将加强国际市场拓展,提升自身在全球市场的竞争力,为行业的发展做出更大的贡献。

Analog Microelectronics GmbH公司的发展小趣事

Analog Microelectronics GmbH是一家德国的半导体公司,专注于开发和生产模拟集成电路(ICs),以及为汽车、工业和医疗等领域提供解决方案。以下是Analog Microelectronics GmbH公司发展的相关故事:

  1. 创立与早期发展:Analog Microelectronics GmbH成立于1984年,总部位于德国巴伐利亚州的兰格维塔赫镇。公司的创始人致力于开发高质量的模拟集成电路,以满足市场对精密电子元件的需求。在创立初期,公司主要专注于生产模拟传感器和信号处理器件。

  2. 技术创新与产品优化:Analog Microelectronics GmbH在技术创新方面持续投入,不断改进和优化其产品线。公司注重研发和设计,致力于提供高性能、高精度和可靠性的模拟集成电路产品。公司的产品包括压力传感器、温度传感器、加速度传感器、电流传感器等,广泛应用于汽车电子、工业自动化、医疗器械等领域。

  3. 市场拓展与客户合作:Analog Microelectronics GmbH通过与全球各行业的客户建立长期稳定的合作关系,不断拓展市场份额和业务范围。公司在欧洲、亚洲和北美等地区设立了销售办事处和代表处,加强了与客户的沟通和服务能力,提高了产品的市场竞争力。

  4. 质量控制与认证:Analog Microelectronics GmbH严格遵循国际质量管理体系标准,对产品的生产过程进行严格控制和管理。公司获得了ISO 9001质量管理体系认证,确保产品质量稳定可靠。此外,公司的产品也符合汽车行业的相关认证标准,如ISO/TS 16949等,为客户提供高品质的产品和服务。

  5. 持续发展与未来展望:作为一家成熟的模拟集成电路供应商,Analog Microelectronics GmbH将继续致力于技术创新和产品研发,以满足不断变化的市场需求。公司将继续加强与客户和合作伙伴的合作关系,拓展业务领域,为全球客户提供更加优质的解决方案和服务。

骏晔科技(DreamLNK)公司的发展小趣事

随着蓝牙技术的普及和市场的快速发展,骏晔科技敏锐地捕捉到了这一趋势。公司投入大量研发资源,成功推出了高性能的CC2340蓝牙模块。这款模块以其出色的性能和稳定性,赢得了市场的广泛认可。同时,骏晔科技还针对IoT远距离通信技术,推出了ChirpLAN™网关套件,进一步巩固了其在蓝牙市场的地位。

Electronic公司的发展小趣事

特斯拉,虽然是一家电动汽车公司,但其在电子行业的发展中也展现出了强大的跨界创新能力。特斯拉通过自主研发和生产电池、电机等核心零部件,成功将电动汽车的性能和品质提升到了新的高度。同时,特斯拉还积极探索自动驾驶、智能交通等前沿技术,不断推动电动汽车行业的变革和发展。特斯拉的跨界创新不仅颠覆了传统汽车行业的格局,也为电子行业带来了新的机遇和挑战。

请注意,以上故事框架仅供参考,具体细节和数据可能需要根据实际情况进行调整和补充。同时,由于篇幅限制,每个故事的字数可能无法满足500字以上的要求。

CNC Tech公司的发展小趣事

CNC Tech公司的创立源于几位电子工程领域的资深专家对于高精度数控加工技术的共同追求。他们发现,随着电子行业的快速发展,对高精度、高效率的数控加工技术的需求日益迫切。于是,他们决定集结力量,共同创立CNC Tech公司,专注于研发和生产先进的数控加工设备。凭借着对技术的执着和热情,CNC Tech在创立初期就成功开发出多款具有竞争力的产品,奠定了其在行业内的技术基石。

问答坊 | AI 解惑

求本书

科学出版社出版的,数字系统设计和数字逻辑电路的ASIC设计 不胜感激!…

查看全部问答>

关于降低CPLD功耗大家有什么经验

关于降低CPLD功耗大家有什么经验,我的95288发热比较厉害…

查看全部问答>

AT ATD如何实现加拨12593拨打电话

比如拨打电话是执行 ATD137106812345; 那平常移动的需要在前面加拨打12593是如何实现的呢?谢谢!…

查看全部问答>

请教关于STC89C516RD+编程的问题

我现在遇到一个问题,在给STC89C516RD+编程后运行,有些芯片(少部分)串口通信数据老是出错。同样的装置、同样的程序、同型号的芯片,运行的结果都不一样。…

查看全部问答>

有烧录卡开发经验的请进 酬金 2万

现有烧录卡一块,需要抄写方案,酬金 2万 联系:QQ:241542042…

查看全部问答>

请问HKEY_LOCAL_MACHINE\System\Events]的作用

我将CE5下的那个电池驱动加到BSP工程中. 在platform.reg中增加. [HKEY_LOCAL_MACHINE\\System\\Events]     \"SYSTEM/BatteryAPIsReady\"=\"Battery Interface APIs\" ; These registry entries load the battery driver.   ...…

查看全部问答>

mtd-utils的nandwrite问题

在移植mtd-utils时遇到个问题,就是使用nandwrite写入文件系统的映像(jffs2格式)时,出现:Unknown flash (not normal NAND)错误,通过查看源码,这个错误是在程序中检测flash的页面大小处打印的,  /* Make sure device page sizes are val ...…

查看全部问答>

求教 DSP 外扩 FLASH 的问题

我正在学DSP,有几个问题: 关于C5416 外扩的FLASH型号该怎么选择,做音频处理的话,一般用什么型号的FLASH? C5416如何跟FLASH连接? 如何读取数据及存储数据? 希望和各位DSP的大牛们能帮帮我,非常感谢!…

查看全部问答>

STM32的USB资料

希望对于大伙有用.…

查看全部问答>

关于nRF24L01+的miso

版主好,大家好,我在用msp430单片机调试nRF24L01+模块,自己模拟spi时序。 网上的资料很多,在正确配置这款模块后,输出的mosi是正确的,但是示波器监测miso没有回来的数。 我想问一下把nRF24L01+这款模块的mosi接到msp430单片机的mosi口线上, ...…

查看全部问答>