历史上的今天
返回首页

历史上的今天

今天是:2025年04月05日(星期六)

2020年04月05日 | 硬核测评,Google 翻译被碾压!「细节狂魔」搞定方言、文言

2020-04-05 来源:大数据文章

    

最近,一款在线机器翻译软件在日本大火。

这款翻译软件名叫 DeepL,大火的原因正是因为它工作太负责了,翻译得太过准确,在日本引起了热议。

从日本网友的民间测评来看,不仅日语方言翻译效果杠杠的,连文言文也被拿下,要知道,这可是连 Google 翻译都无法做到的事。

但是有多精确呢?作为一个严谨的科技软件,当然还是要用数据来说话,DeepL 官方也公开了日英互译和中英互译的盲测结果,如下图所示,可以看出,DeepL 简直就是碾压级的存在嘛:

盲测就是在专业译员评审们不知道哪个翻译版本是由哪个网站翻译的情况下,对翻译文本进行评估,这也一直是 DeepL 的测试方式之一。

DeepL 由于极好的准确性,也同样引爆了 Reddit,有网友指出,DeepL 不是像 Google 翻译那样从字词上进行翻译,从 Textractor 的设置上可以看到,DeepL 还支持用以前的翻译作为上下文对翻译结果进行改善

也有不少网友直呼「DeepL 牛逼」!

3 年前,DeepL 刚出现在大众视野的时候就已经吸引到了不少目光,DeepL 首席执行官 Gereon Frahling 曾表示,DeepL 的目标不止于翻译任务,神经网络将从理解文本开始,开启更多可能。

至于更多可能是如何被开发出来的,文摘菌做了一次小小的测评,然后再一起来围观 DeepL 的发家史,小板凳已经放好,欢迎就坐~

方言、文言文、学术论文,机器翻译神仙打架

不管是民间测评还是 DeepL 官方的盲测结果,都暗示着 DeepL 可能是目前准确率最高的机器翻译,到底成色怎样,还是要亲自动手试试才知道。

既然本次更新也包含了简体中文,抱着一点点的怀疑和一点点的好奇,文摘菌也对 DeepL 进行了一次简单的测评,和目前主流的 Google 翻译、微软翻译、百度翻译、有道翻译进行了比较

本次测评分为三轮,第一轮方言,第二轮文言文,第三轮学术论文。好,现在我们有请五位选手入场。

第一轮:方言

大家都知道,中国方言文化博大精深,要是不能正确译出方言,那这个准确率还是要打上问号的。

我们选择了东北话十级题目:「我嘞个去,你长得也太磕碜了」。本题有两个得分点,一个是「我嘞个去」,一个是「磕碜」。让我们来看看五位选手的表现。

在第一个得分点上,Google 翻译成了「I’ll go there」,微软和百度认为这是「I’ll go」的意思,有道则给出「I don’t know」的答案,DeepL 表现很好,正确翻译成了带有惊讶语气的「oh my god」。

在第二个得分点上,五位选手都给出了不同的答案,Google「shy」、微软「snobful」、百度「shabby」、有道「bad」,DeepL「ugly」。

从得分点上看,百度在第二题表现尚可,有道…勉强过关吧,Google 和微软则全军覆没。我们来欣赏一下 DeepL 的满分试卷

这才第一题,不要担心,还有翻身的机会。接下来我们来看看文言文,既然 DeepL 都能翻译古日文,要是不能翻译古汉语可就不对了。

第二轮:文言文

文言文部分我们以著名唐代诗人张九龄《望月远怀》中的名句「海上生明月,天涯共此时」为考题,这句诗的意思是,在辽阔无边的大海上升起一轮明月,使人想起了远在天涯海角的亲友,他此时此刻也该是望着同一轮明月吧。

本题的得分点是看看各位选手能否用英文把整句诗的意境表达出来。好了,中文版的标准答案已经公布,那么五位选手的表现如何呢?

首先从句意上看,Google、微软和百度都直接放弃了后半句的翻译,有道把后半句译成「Tianya at this time」;在前半句的翻译上,微软和百度都用到了 born 这个词,但是微软的译文是「The sea is born」????

我们来看看 DeepL,前半句和 Google 的答案一模一样,但是后半句的翻译是不是达到了信达雅的水平文摘菌不知道,但是读上去感觉非常舒服,大家也来品品

第三轮:学术论文

学术论文的关键除了语句通顺外,还需要在专业词汇上做到准确,这也是本次考察的重点。

中译英部分,我们选择的是去年刊登在《国际新闻界》上的一篇文章,研究者调查的是社交媒体信任对隐私风险感知和自我表露的影响。

原文:实证结果显示:1. 隐私风险感知与自我表露并无显著相关性;2. 社交媒体信任负向影响用户的隐私风险感知,网络人际信任在其中发挥中介作用;3. 社交媒体信任正向影响用户的自我表露,网络人际信任在其中发挥中介作用。

从翻译结果上看,五位选手给出的答案都比较让人满意,句型和语法也都没有问题,只是在一些具体的用词上各有千秋。比如,「自我表露」,DeepL 和微软用的是「self-expression」,其余三位选手用的是「self-disclosure」;而「网络人际信任」,有道、百度和微软译成「network interpersonal trust」,Google 给出「online interpersonal trust」的答案,DeepL 则译为「cyber-interpersonal trust」。

照例,我们还是来看看 DeepL 的答案。

在英译中部分,我们选择了上周文摘菌报道的帝国理工大学论文的导论部分。在用户体验上文摘菌要插播一下,从中译英切换到英译中的时候,只有百度、有道和 DeepL 做到了自动识别,Google 和微软仍需要手动选择语言。

原文:The global impact of COVID-19 has been profound, and the public health threat it represents is the most serious seen in a respiratory virus since the 1918 H1N1 influenza pandemic. Here we present the results of epidemiological modelling which has informed policymaking in the UK and other countries in recent weeks. In the absence of a COVID-19 vaccine, we assess the potential role of a number of public health measures – so-called non-pharmaceutical interventions (NPIs) – aimed at reducing contact rates in the population and thereby reducing transmission of the virus. In the results presented here, we apply a previously published microsimulation model to two countries: the UK (Great Britain specifically) and the US. We conclude that the effectiveness of any one intervention in isolation is likely to be limited, requiring multiple interventions to be combined to have a substantial impact on transmission.

从结果上看,五位选手的学术造诣都比较高,学术语言使用的规范性也都相差不大。但是,细节见真知,只有有道保留了双破折号的使用,但这在中文中其实并不常见;除有道外,其他三位选手在「非药物干预措施(NPI)」的表达上都没有做到尽善尽美。

仍然,笑到最后的还是 DeepL,虽然还存在各种小问题,无法得到满分,但也是一张妥妥的高分试卷了:

以上就是本次测评全部的考题了,可以看出 DeepL 不愧是头号种子选手,不管是方言、文言文还是学术话语,都有不错的表现,看来 DeepL 官方还是很诚实的嘛。

从 Linguee 蜕变,机器学习赋能 DeepL

见识到了 DeepL 的「独秀」表现,接下来,我们就重点介绍一下本次测评表现最佳的头号种子 DeepL。

不知道 DeepL?那 Linguee 应该听说过吧,就是那个运营十多年的在线外语词典,DeepL 的前身正是 Linguee。Linguee 是一款出现多年的翻译工具,尽管使用广泛,也有一批忠实用户,但其翻译质量尚无法与 Google 翻译相提并论,尤其是考虑到后者品牌和地位的巨大优势。

真正重要的是 Linguee 的技术积累,Linguee 的联合创始人 Gereon Frahling 之前就在 Google 研究院工作,2007 年,他选择开启新的征程,团队数年来一直致力于机器翻译,直到 2016 年,他们才开始全力开发全新的系统,建设新公司,也就是 DeepL。

Linguee 的核心竞争优势就是爬虫和机器学习系统,前者能够抓取互联网上超过 10 亿句翻译结果和查询的大型数据库,后者在网页上搜索相似片段的真实翻译方法并对其评估,两者结合使 Linguee 成为了当时「世界上首个翻译搜索引擎」

十年积累下来,Linguee 无论在数据和对算法的研究上都不可小觑,而这也直接成为 DeepL 的绝对优势,为团队训练新模型打好了坚实的基础。

DeepL 变革性的神经架构在冰岛的一台超级计算机上运行,该计算机能力为 5.1 petaFLOPS(每秒 5100 万亿次操作)不到一秒内能翻译 100 万单词。「冰岛可再生能源丰富,因此我们可以在这里用非常低廉的成本训练我们的神经网络。我们将继续专注于高性能硬件」,DeepL 的 CTO Jaroslaw Kutylowski 说。

「我们的神经网络架构已经实现了多个显著改善」,Gereon Frahling 表示,「通过用不同的方式安排神经元及其连接,我们的网络比目前其他神经网络更全面地映射自然语言。

大学、研究机构和 Linguee 的竞争对手发布的研究进展表明,卷积神经网络才是机器翻译的正确道路,而非 DeepL 之前使用的循环神经网络,但现在不是探讨二者区别的时候,对于相关词语的长、复杂字符串,只要你能够控制其弱点,卷积神经网络效果会更好。

例如,CNN 一次处理一个单词,当句末单词决定句首单词的形成时,这就成了问题。查找整个句子寻找句首单词,如果网络获取到的第一个单词是错误的,就太浪费了,还得使用该知识重新开始,因此 DeepL 和机器学习领域的其他机构在 CNN 转向下一个单词或词组时,使用能够监控此类潜在问题的「注意力机制」来解决。

DeepL 在最新版本增加了对日语和中文(简体)的支持,包括日语汉字,平假名和片假名以及数千个汉字。目前,DeepL 支持的语言数量增加到 11 种,虽然语言支持不如其他翻译服务广泛,如 Google Translate 和 Bing Microsoft Translator 均支持一百多种不同的语言,但翻译精度也是不可忽视的关键点。

掌握多国语言的 Techcrunch 编辑 Frederic 曾这么评价 DeepL:「Google 翻译的风格非常直接,但却错过了一些细节和习语(或者把这些习语翻译错了),而 DeepL 经常可以提供更加自然的翻译效果,就像训练有素的人类翻译一样。」

说了这么多,还是那句话,真真假假还是自己试了才知道,有兴趣的同学可以亲自动手试试,要是遇到什么好玩的翻译结果还记得告诉文摘菌噢~


推荐阅读

史海拾趣

Good Sky Electric Co Ltd公司的发展小趣事
电机过热可能是由于负载过大、电机散热不良、电源电压不稳定或电机内部故障等原因造成的。在排查时,可以首先检查电机负载是否超出额定范围,然后检查散热系统是否正常运行,如风扇是否转动、散热片是否清洁等。同时,还应检查电源电压是否稳定,以及电机内部是否有短路或断路现象。
Bytes公司的发展小趣事

随着市场规模的扩大,Bytes公司意识到供应链管理和成本控制的重要性。公司不断优化供应链结构,提高采购效率和质量,降低生产成本。同时,公司还通过精细化管理,降低运营成本,提高盈利能力。这些措施使得Bytes公司在激烈的市场竞争中保持了良好的财务状况。

DYMO公司的发展小趣事

DYMO公司成立于20世纪XX年代,由发明家XXX创立。XXX先生对标签打印技术的潜力有着深刻的洞察,他相信这项技术将极大地提高办公效率。他带领团队研发了第一款便携式标签打印机,这款产品以其易用性和便携性迅速赢得了市场的认可。DYMO公司的成功,从创始人XXX的远见和决心开始。

EPIGAP公司的发展小趣事

为了进一步扩大市场份额,EPIGAP公司开始实施国际化战略。公司先后在多个国家和地区设立了办事处和研发中心,以便更好地了解当地市场需求和技术发展趋势。通过与国际客户的深入合作,EPIGAP公司的产品逐渐打入国际市场,赢得了广泛的认可和赞誉。

ETL [E-Tech Electronics LTD]公司的发展小趣事

ETL始终将品质管理和客户服务放在首位。公司建立了完善的质量管理体系,从原材料采购到生产、检测、包装等各个环节都进行严格的质量控制。同时,ETL还注重提升客户服务水平,为客户提供全方位、个性化的服务。这些措施使得ETL的产品质量得到了客户的高度认可,也为公司赢得了良好的口碑。

统宇电研(Coilmaster)公司的发展小趣事

统宇电研深知品质对于企业的重要性,因此一直将品质管理作为公司的核心竞争力之一。公司建立了严格的品质管理体系,从原材料采购到产品出厂的每一个环节都进行严格把关。同时,统宇电研还注重员工品质意识的培养和提高,通过培训和实践相结合的方式不断提升员工的品质素养。这些努力使得统宇电研的产品品质得到了客户的广泛认可。

问答坊 | AI 解惑

发布一块Renesas开发板的全部资料

Renesas单片机前身是三菱和日立单片机的联盟。因此每年出货量全球第一位。 设计了一块对此单片机的评估板,也可以说是一块开发板。(板子已经在制版,焊接好发图片,下周五之前) 因为不涉及公司机密,将在这个帖子里面发布我的所有资料。只是可惜 ...…

查看全部问答>

现场总线温度变送器原理及应用

一、引言   信息技术的飞速发展,引起了自动化系统结构的变革,逐步形成了以网络集成自动化系统为基础的企业信息系统。现场总线就是顺应这一形势发展起来的新技术。现场总线是应用在生产现场,在微机化测量控制设备(称为现场总线仪表)之间实 ...…

查看全部问答>

LM324四运放的应用.pdf

本帖最后由 paulhyde 于 2014-9-15 09:28 编辑 大赛中很有用哦~~~  …

查看全部问答>

DeviceIoControl与u盘硬件通信

利用DeviceIoControl()与u盘进行通信, 通信方式为IOCTL_SCSI_PASS_THROUGH_DIRECT, 这里需要一个CDB命令块,这个CDB命令是如何得到的。 我看到别人的程序中有BYTE Cdb[6] = {0x12,        0x01,      &n ...…

查看全部问答>

进制转化问题

数值的补码表示分两种情况: (1)正数的补码:与原码相同。 (2)负数的补码:符号位为1,其余位为该数绝对值的原码按位取反;然后整个数加1。 每当有人问我怎么把原码转化成补码时我就这样告诉他,自己也是这么求的。可是我不知道为什么要 ...…

查看全部问答>

为什么我不可以在MiniIDE里的output里做rd,t f之类debug?

我在miniIDE 里不能输入rd来注册输出,按不了回车。…

查看全部问答>

只要使用printf函数,硬件仿真就不正常

为什么我只要使用printf函数,硬件仿真就不正常,死在汇编“0x080016AC BEAB      BKPT     0xAB”位置不动。怎么也想不明白啊。请教各位啊,两天了卡在这里。…

查看全部问答>

求助贴:关于IR2110驱动问题

本帖最后由 paulhyde 于 2014-9-15 03:48 编辑 本人最近搭了一个IR2110的驱动电路,用示波器看低端输出,波形是正常的方波,但是高端输出的波形畸变得很诡异,自举电容两端测了一下也有13V多,算不算已经自举起来了啊?纠结得不行,有没有哪位好心 ...…

查看全部问答>

BeagleBone外围电路设计最终版

昨晚奋斗了一下,终于把PCB整晚了。 系统框图如下: PCB正面: PCB反面: …

查看全部问答>

[自制运放]哪位菊苣能够推荐一下做运放的书或者资料呀[小女子在这感谢了TAT]

因为最近需要自己做一个运放,但是感觉静态工作点那些设不好,效果不好。。 我所说的做运放是指用三极管直接搭,不是微电子里面的那种。 哪位菊苣能够推荐一下看哪些资料啊!!《不要那种笼统的,比如直接给一个运放里面的三极结构,我觉着我的三 ...…

查看全部问答>