基于短语模糊匹配和句子扩展的统计翻译方法.pdfVIP

  • 8
  • 0
  • 约1.93万字
  • 约 9页
  • 2017-09-14 发布于重庆
  • 举报

基于短语模糊匹配和句子扩展的统计翻译方法.pdf

基于短语模糊匹配和句子扩展的统计翻译方法 刘鹏,宗成庆 ( 中国科学院 自动化研究所 模式识别国家重点实验室,北京 100190) 摘要:近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较 的翻译性能。 但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,一方面,有些短 语在训练获得的短语表中找不到精确的匹配,使其成为未知短语;另一方面,短语表中大量的短语无法得 到充分的利用。为此,我们提出了基于短语模糊匹配和句子扩展的翻译方法。对于不存在于短语表中的短 语,通过模糊匹配的办法,寻找与其相似的短语,然后将所有相似短语用于替换原短语,从而生成扩展句 子,在此基础上对所有扩展的句子进行翻译。由于并不是所有扩展后的句子都能提高原始句子的翻译效果, 因此,我们在句子翻译完成后设置了组合分类器用于选择最优翻译结果。实验证明,这 方法可以有效地 提高翻译系统的译文质量。 关键词:机器翻译;基于短语的统计机器翻译;模糊匹配;组合分类器 中图分类号:TP391 文献标识码:A Approach to Statistical Machine T

文档评论(0)

1亿VIP精品文档

相关文档