基于词语对齐融合提高统计机器翻译质量PowerPoin.pptxVIP

  • 3
  • 0
  • 约3.59千字
  • 约 22页
  • 2021-08-18 发布于北京
  • 举报

基于词语对齐融合提高统计机器翻译质量PowerPoin.pptx

基于词语对齐融合提高统计机器翻译质量 张春越 哈尔滨工业大学机器智能与翻译研究室提纲研究动机两种词对齐结果分析词对齐结果融合策略实验设置与结果分析结论与未来工作研究动机词对齐是当前主流机器翻译技术的基础目前广泛使用的是Giza++实现的IBM Model4 对齐模型近年来,研究者也相继提出不少其他的词对齐方法不同的词对齐工具并没有绝对意义上的优劣之分 目前学术界对词对齐质量和机器翻译性能之间的关系还没有一个明确的共识 本文切入点给定两种差异较大的词对齐工具 ,在同一语料上进行词对齐获取 利用这两组不同词对齐的语料共同训练机器翻译模型,是否可以提高机器翻译性能?提纲研究动机两种词对齐结果分析词对齐结果融合策略实验设置与结果分析结论与未来工作两种词对齐工具 IBM词对齐模型GIZA++ 两个方向“grow-diag-final” 合并为 n-to-m对齐 HIT-MITLAB词对齐模型 统计和词典相结合贪心算法实现 SSMT07语料上对齐结果差异度分析Step1: 分别进行GIZA++词对齐(GIZA++双向一对多词对齐,然后采用“grow-diag-final”启发式策略获得双向词对齐,下文用 “G” 代称)和HIT-MITLAB词对齐(下文用 “H” 代称);Step2: 对两组词对齐结果计算其并集(H∪G)、交集(H∩G)、差集(H-G, G-H);Step3: 合并两组词对齐语

文档评论(0)

1亿VIP精品文档

相关文档