- 1
- 0
- 约2.8千字
- 约 21页
- 2017-08-18 发布于广东
- 举报
基于词语对齐融合提高统计机器翻译质量 张春越 哈尔滨工业大学机器智能与翻译研究室 提纲 研究动机 两种词对齐结果分析 词对齐结果融合策略 实验设置与结果分析 结论与未来工作 研究动机 词对齐是当前主流机器翻译技术的基础 目前广泛使用的是Giza++实现的IBM Model4 对齐模型 近年来,研究者也相继提出不少其他的词对齐方法 不同的词对齐工具并没有绝对意义上的优劣之分 目前学术界对词对齐质量和机器翻译性能之间的关系还没有一个明确的共识 本文切入点 给定两种差异较大的词对齐工具 ,在同一语料上进行词对齐获取 利用这两组不同词对齐的语料共同训练机器翻译模型,是否可以提高机器翻译性能? 提纲 研究动机 两种词对齐结果分析 词对齐结果融合策略 实验设置与结果分析 结论与未来工作 两种词对齐工具 IBM词对齐模型 GIZA++ 两个方向 “grow-diag-final” 合并为 n-to-m对齐 HIT-MITLAB词对齐模型 统计和词典相结合 贪心算法实现 SSMT07语料上对齐结果差异度分析 Step1: 分别进行GIZA++词对齐(GIZA++双向一对多词对齐,然后采用“grow-diag-final”启发式策略获得双向词对齐,下文用 “G” 代称)和HIT-MITLAB词对齐(下文用 “H” 代称); Step2: 对两组词对齐结果计算其并集(H∪G)、交
您可能关注的文档
最近下载
- 任务一 制定产品与客户服务策略.pptx VIP
- 《大学语文》第四章 戏剧(另有配套教案).pptx VIP
- GB50242-2002建筑给水排水及采暖工程施工质量.doc VIP
- 会员模式培训课件.ppt VIP
- (完整版)《建筑给水排水及采暖工程施工质量验收规范》(GB50242-2002).docx VIP
- (四调)武汉市2026届高三年级四月调研考试化学试卷(含答案).pdf
- 压力容器设计质量保证手册.doc VIP
- 2026年无锡中考地理备考全指南(考点+真题+计划+技巧).docx VIP
- 武汉市2026届高三(四调)生物试卷(含答案及解析).pdf
- 医疗废物的分类与处理流程幻灯片.ppt VIP
原创力文档

文档评论(0)