基于统计的机器翻译.pptVIP

  • 23
  • 0
  • 约2.73千字
  • 约 11页
  • 2017-07-01 发布于湖北
  • 举报
基于统计的机器翻译

2. Corpus-based system 基于语料库的机器翻译系统 概念:不同于基于规则的机译系统由词典和语法规则库构成翻译知识库,基于语料库的机译系统是以语料库(P121-P122)的应用为核心,由经过划分并具有标注的语料库构成知识库,以统计规律为主。 分类: (1)基于统计(Statistics-based)的机器翻译 (2)基于实例(Example-based)的机器翻译 发展时期: 20世纪80年代(计算机技术和互联网技术的迅猛发展) 代表人物: 香农:香农模式,噪声信道模型 P122 机器翻译之父:1947年Weaver提出的“解码思想” P123 (1)基于统计(Statistics-based)的机器翻译 统计机器翻译的基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。 通俗地说,源语到目的语的翻译是一个概率统计问题,任何一个目的语句子都有可能是任何一个源语句的译文,只是概率不同,机器翻译的任务就是找到概率最大的句子。 具体方法是将翻译看做对原文通过模型转换为译文的解码过程。 1、模型问题:就是为机器翻译建立概率模型,也就是要定义源语到目的语的翻译概率的计算方法。 2、训练问题:利用语料库来得到这个模型的所有参数。 3、解码问题:在已知模型和

文档评论(0)

1亿VIP精品文档

相关文档