- 8
- 0
- 约1.93万字
- 约 9页
- 2017-09-14 发布于重庆
- 举报
基于短语模糊匹配和句子扩展的统计翻译方法
刘鹏,宗成庆
( 中国科学院 自动化研究所 模式识别国家重点实验室,北京 100190)
摘要:近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较 的翻译性能。
但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,一方面,有些短
语在训练获得的短语表中找不到精确的匹配,使其成为未知短语;另一方面,短语表中大量的短语无法得
到充分的利用。为此,我们提出了基于短语模糊匹配和句子扩展的翻译方法。对于不存在于短语表中的短
语,通过模糊匹配的办法,寻找与其相似的短语,然后将所有相似短语用于替换原短语,从而生成扩展句
子,在此基础上对所有扩展的句子进行翻译。由于并不是所有扩展后的句子都能提高原始句子的翻译效果,
因此,我们在句子翻译完成后设置了组合分类器用于选择最优翻译结果。实验证明,这 方法可以有效地
提高翻译系统的译文质量。
关键词:机器翻译;基于短语的统计机器翻译;模糊匹配;组合分类器
中图分类号:TP391 文献标识码:A
Approach to Statistical Machine T
您可能关注的文档
最近下载
- 05G512:钢天窗架 国标图集.pdf VIP
- 供水公司安全生产责任制及职责.docx VIP
- 【新教材】仁爱科普版(2024)七年级下册英语Unit 10 Lending a helping hand教案(共8课时).docx
- 铁门关经济技术开发区纺织服装园区污水处理厂工程环境影响报告书.PDF VIP
- 医学伦理学考试题与答案.docx VIP
- XXX高级职业中学办学章程.docx
- 山东省济南市历下区2026届中考语文考前最后一卷含解析.doc VIP
- “技能兴威”威海市第二届职业技能大赛技术文件--数控铣(含赛题).docx VIP
- 05G513 钢托架设计图集--.pdf VIP
- 《运筹学》期末考试试卷A-答案.docx VIP
原创力文档

文档评论(0)