统计机器翻译简介..pptVIP

  • 5
  • 0
  • 约1.09万字
  • 约 56页
  • 2016-12-28 发布于山西
  • 举报
统计机器翻译简介 刘群 liuqun@ 统计机器翻译方法的特点 利用语料库作为知识来源 区别于规则方法: 无需人工编写规则 建立完整的统计模型 区别于实例方法或模板方法: 必须为整个翻译过程建立统计模型 统计机器翻译的分类 基于平行概率语法的统计机器翻译模型 基于信源信道思想的统计机器翻译模型 IBM的Peter Brown等人首先提出 目前影响最大 几乎成为统计机器翻译的同义词 基于最大熵的统计机器翻译模型 源于基于特征的自然语言理解 Och提出,获ACL2002最佳论文 统计机器翻译的优缺点 优点 无需人工编写规则,利用语料库直接训练得到机器翻译系统;(但可以使用语言资源) 系统开发周期短; 鲁棒性好; 译文质量好; 缺点 时空开销大; 数据稀疏问题严重; 对语料库依赖性强; 算法研究不成熟。 基于平行概率语法的统计机器翻译模型 基本思想 两种语言建立一套平行的语法规则, 规则一一对应 两套规则服从同样的概率分布 句法分析的过程决定了生成的过程 主要模型 Alshawi的基于Head Transducer的MT模型 吴德恺的Inverse Transduction Grammar(ITG) Takeda的Pattern-based CFG for MT Head Transducer MT (1) Head Transducer(中心词转录机)是一种Definite St

文档评论(0)

1亿VIP精品文档

相关文档