CWMT08统计机器翻译研讨会自动化所技术报告.pptVIP

  • 4
  • 0
  • 约4.4千字
  • 约 35页
  • 2017-02-28 发布于湖北
  • 举报

CWMT08统计机器翻译研讨会自动化所技术报告.ppt

CWMT08统计机器翻译研讨会自动化所技术报告

报告提纲 引言 参评系统描述 实验结果 结论 引 言 自动化所作为参评单位之一参加了所有的四个评测任务,即: 新闻的汉英翻译评测任务; 新闻的英汉翻译评测任务; 科技的英汉翻译评测任务 新闻的汉英融合评测任务。 参评系统描述 在这次评测中我们共有四个系统参加,即: 自主开发的基于短语的翻译系统(BPSMT); 开源基于短语的翻译系统(Moses); 基于中心词的概率化句法调序系统Bandore; 基于词语调序的对齐方法融合系统(WRABC)。 BPSMT 模型训练: 语言模型利用开源Srilm工具包来获取四元文法概率信息; 翻译模型主要是根据开源Moses工具包来获取翻译短语表,其中的参数设置都利用Moses工具包的默认设置; 解码算法采用Beam-Search进行单调搜索获取翻译结果。 Moses 模型训练: 利用Moses的默认设置来进行训练解码 只用到了词这一个信息作为特征,没有使用因子模型。 Bandore 作为前端调序处理; 关键思想: 基于中心词的调序,中心词包括动词与名词,调序的候选对象是动词修饰语以及名词修饰语; Bandore 方法概要: 由一个源语言句子得到一棵句法树; 从句法树的根开始递归地考察每一个动词短语和名词短语,并利用最大熵的方法指导训练中心词(动词、名词)的修饰语是否需调至中心词的另一侧。 WRABC WRABC

文档评论(0)

1亿VIP精品文档

相关文档