基于统计的机器翻译.pptVIP

下载本文档

23
0
约2.73千字
约 11页
2017-07-01 发布于湖北
举报

基于统计的机器翻译.ppt

基于统计的机器翻译

2. Corpus-based system基于语料库的机器翻译系统概念：不同于基于规则的机译系统由词典和语法规则库构成翻译知识库，基于语料库的机译系统是以语料库(P121-P122)的应用为核心，由经过划分并具有标注的语料库构成知识库，以统计规律为主。分类： (1)基于统计（Statistics-based）的机器翻译 (2)基于实例（Example-based）的机器翻译发展时期： 20世纪80年代（计算机技术和互联网技术的迅猛发展）代表人物：香农：香农模式，噪声信道模型 P122 机器翻译之父：1947年Weaver提出的“解码思想” P123 （1）基于统计（Statistics-based）的机器翻译统计机器翻译的基本思想是通过对大量的平行语料进行统计分析，构建统计翻译模型，进而使用此模型进行翻译。通俗地说，源语到目的语的翻译是一个概率统计问题，任何一个目的语句子都有可能是任何一个源语句的译文，只是概率不同，机器翻译的任务就是找到概率最大的句子。具体方法是将翻译看做对原文通过模型转换为译文的解码过程。 1、模型问题：就是为机器翻译建立概率模型，也就是要定义源语到目的语的翻译概率的计算方法。 2、训练问题：利用语料库来得到这个模型的所有参数。 3、解码问题：在已知模型和

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于统计的机器翻译.pptVIP