跳到内容

机器翻译/统计

来自维基教科书,开放世界中的开放书籍

统计机器翻译

[编辑 | 编辑源代码]

语言模型

[编辑 | 编辑源代码]

语言模型用于 MT 的 a) 对任意词语序列 (token) 进行评分,以及 b) 给定一个 token 序列,预测下一个最有可能出现在该序列中的 token。正式地说,语言模型是在给定语言中 token 序列上的概率分布。

N-gram 模型

[编辑 | 编辑源代码]

基于字符的模型

[编辑 | 编辑源代码]

最近,人们发现可以使用子词、字符甚至字节作为语言建模的基本单元[需要引用]。有一些活动特别关注此类模型,以及一般情况下在子词单元上处理语言数据,例如SCLem 2017

翻译模型

[编辑 | 编辑源代码]

IBM 模型 1-5

[编辑 | 编辑源代码]

基于短语的模型

[编辑 | 编辑源代码]

分解翻译模型

[编辑 | 编辑源代码]

基于句法和树的模型

[编辑 | 编辑源代码]

同步短语语法

[编辑 | 编辑源代码]

平行树库

[编辑 | 编辑源代码]

句法规则提取

[编辑 | 编辑源代码]
[编辑 | 编辑源代码]

混合系统

[编辑 | 编辑源代码]

机器辅助翻译

[编辑 | 编辑源代码]

翻译记忆库

[编辑 | 编辑源代码]
华夏公益教科书