下载中心
机器翻译:基础与模型pdf
1星 发布者: sigma

2022-07-01 | 1积分 | 6.86MB |  3 次下载

下载 收藏 评论

文档简介
标签: 机器翻译

机器翻译

本书呈现了近30年内机器翻译技术发展的进程及研究热点,并围绕机器翻译的统计建模和深度学习方法这两个主题对机器翻译的技术方法进行了全面介绍,同时对信息化时代下的机器翻译技术的发展及应用予以透析,其中也涉及小牛团队大量的实践经验,包括许多机器翻译系统开发的细节,帮助相关研究者或从业人员更好地了解信息时代下的机器翻译技术的发展脉搏。

本书不单单是一本理论书籍,它还结合了机器翻译的应用,给读者提供了很多机器翻译技术落地的具体思路。本书内容全面、严谨详实,通过四大部分共计十八章的内容对机器翻译的统计建模和深度学习方法进行较为系统地介绍,不仅有相应的原理介绍和实现代码,还提供了实战案例,并通过图例对一些形式化的定义和算法进行解释(共395张插图),为读者揭开机器翻译的奥秘。本书用tex编写,所有源代码均已开放。

Part I 机器翻译基础

机器翻译简介

1.1 机器翻译的概念

1.2 机器翻译简史

1.3 机器翻译现状及挑战

1.4 基于规则的方法

1.5 数据驱动的方法

1.6 推荐学习资源

统计语言建模基础

2.1 概率论基础

2.2 掷骰子游戏

2.3 n-gram 语言模型

2.4 预测与搜索

2.5 小结及拓展阅读

词法分析和语法分析基础

3.1 问题概述

3.2 中文分词

3.3 命名实体识别

3.4 句法分析(短语结构分析)

3.5 小结及拓展阅读

翻译质量评价

4.1 译文质量评价所面临的挑战

4.2 人工评价

4.3 有参考答案的自动评价

4.4 无参考答案的自动评价

4.5 小结及拓展阅读

Part II 统计机器翻译

基于词的机器翻译建模

5.1 词在翻译中的作用

5.2 一个简单实例

5.3 噪声信道模型

5.4 统计机器翻译的三个基本问题

5.5 IBM 模型1

5.6 小结及拓展阅读

基于扭曲度和繁衍率的模型

6.1 基于扭曲度的模型

6.2 基于繁衍率的模型

6.3 解码和训练

6.4 问题分析

6.5 小结及拓展阅读

基于短语的模型

7.1 翻译中的短语信息

7.2 数学建模

7.3 短语抽取

7.4 翻译调序建模

7.5 翻译特征

7.6 最小错误率训练

7.7 栈解码

7.8 小结及拓展阅读

基于句法的模型

8.1 翻译中句法信息的使用

8.2 基于层次短语的模型

8.3 基于语言学句法的模型

8.4 小结及拓展阅读

Part III 神经机器翻译

人工神经网络和神经语言建模

9.1 深度学习与人工神经网络

9.2 神经网络基础

9.3 神经网络的张量实现

9.4 神经网络的参数训练

9.5 神经语言模型

9.6 小结及拓展阅读

基于循环神经网络的模型

10.1 神经机器翻译的发展简史

10.2 编码器-解码器框架

10.3 基于循环神经网络的翻译建模

10.4 注意力机制

10.5 训练及推断

10.6 小结及拓展阅读

基于卷积神经网络的模型

11.1 卷积神经网络

11.2 基于卷积神经网络的翻译建模

11.3 局部模型的改进

11.4 小结及拓展阅读

基于自注意力的模型

12.1 自注意力机制

12.2 Transformer 架构

12.3 位置编码

12.4 基于点乘的多头注意力机制

12.5 残差网络和层标准化

12.6 前馈全连接网络子层

12.7 训练

12.8 推断

12.9 小结及拓展阅读

Part IV 机器翻译前沿

神经机器翻译模型训练

13.1 开放词表

13.2 正则化

13.3 对抗样本训练

13.4 学习策略

13.5 知识蒸馏

13.6 基于样本价值的学习

13.7 小结及拓展阅读

神经机器翻译模型推断

14.1 面临的挑战

14.2 基本问题

14.3 轻量模型

14.4 非自回归翻译

14.5 多模型集成

14.6 小结及拓展阅读

神经机器翻译结构优化

15.1 注意力机制的改进

15.2 神经网络连接优化及深层模型

15.3 基于句法的神经机器翻译模型

15.4 基于结构搜索的翻译模型优化

15.5 小结及拓展阅读

低资源神经机器翻译

16.1 数据的有效使用

16.2 双向翻译模型

16.3 多语言翻译模型

16.4 无监督机器翻译

16.5 领域适应

16.6 小结及拓展阅读

多模态、多层次机器翻译

17.1 机器翻译需要更多的上下文

17.2 语音翻译

17.3 图像翻译

17.4 篇章级翻译

17.5 小结及拓展阅读

机器翻译应用技术

18.1 机器翻译的应用并不简单

18.2 增量式模型优化

18.3 交互式机器翻译

18.4 翻译结果的可干预性

18.5 小设备机器翻译

18.6 机器翻译系统的部署

18.7 机器翻译的应用场景

Part V 附录

附录 A:开源机器翻译系统

附录 B:评测任务及基准数据集

附录 C:IBM模型2-5训练方法

评论
推荐下载
查看更多
相关视频
  • 控制系统仿真与CAD

  • PLC功能指令应用详解

  • 微波毫米波电路分析与设计

  • Android车载系统框架

  • 天线原理与基本参数

  • 嵌入式电机驱动 SoC NSUC1610 的座椅通风应用解说

推荐帖子
精选电路图
  • PIC单片机控制的遥控防盗报警器电路

  • 使用ESP8266从NTP服务器获取时间并在OLED显示器上显示

  • 带有短路保护系统的5V直流稳压电源电路图

  • 如何构建一个触摸传感器电路

  • 如何调制IC555振荡器

  • 基于ICL296的大电流开关稳压器电源电路

×