成语大全网 - 成语解释 - 机器翻译的流程(原理)是怎么样的?

机器翻译的流程(原理)是怎么样的?

统计翻译系统的根本不同,在于它们试图生成不止一个精确的翻译。相反,他们生成成千上万种可能的翻译,然后他们按照可能最正确的给这些翻译排名。他们通过与训练数据的相似性来估计有多“正确”。以下是它的工作原理:

第1步:将原始句子分成块首先,我们将我们的句子分成简单的块,每一块都可以轻松翻译:第2步:找到每一块的所有可能的翻译接下来,我们将翻译每块文字,我们将通过寻找我们数据库中所有人类翻译过的相同词块来完成我们的翻译。要着重注意的是,我们不只是在一本简简单单的翻译字典中查找这些词块。相反,我们看到是真实的人在真实的句子中如何翻译这些相同的词。这有助于我们捕获到在不同语境中所有不同的表达方式:即使最常见的短语也有很多种可能的翻译这些可能的翻译中的有一些会比其他翻译更频繁地使用。根据我们训练数据中每个翻译出现的频率,我们可以给它设定一个分数。例如,有人说“Quiero”更多的时候是指“我想要”而不是“我尝试”。所以,我们可以使用我们训练数据中 “Quiero”被翻译成“我想要”的频率,给“我想要”这个翻译更多的权重。

第3步:生成所有可能的句子,找到最有可能的那句接下来,我们将使用这些词块的每种可能翻译来组合生成一堆可能的句子。