- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于译文加权的BLEU改进方法.ppt
基于译文加权的BLEU改进方法 杨沐昀 哈尔滨工业大学 计算机学院 机器智能与翻译研究室 内容提要 引言 BLEU用于汉语译文性能的实证分析 基于线性回归的BLEU改进 实验与分析 一、引言 BLEU:机器翻译自动评价方法 基于N-gram精确率 2002年IBM提出 目前采用最广泛 忽略译文的个性信息 词性、连续正确译文长度 基于译文加权BLEU改进 二、BLEU方法及分析 1、传统的BLEU方法 基本n-gram精确率公式: 二、BLEU方法及分析 1、传统的BLEU方法 引入惩罚因子后,最终的BLEU计算公式如下所示: 其中Wn是n元短语的权重,这里通常取Wn =1/N;N是取得最大的n元短语的元数,这里通常取 N=4 。 这样的BLEU的得分是一个0-1之间的数,较高的得分表示译文质量越高。接近1的得分表示候选译文和参考译文就已经非常接近了。 二、BLEU方法及分析 2、BLEU方法用于汉语译文性能分析 数据: 某英语水平考试英汉翻译试题 1段英文、3个句子 1个标准译文+3个手工译文 152篇翻译,阅卷点正式评分 满分:12分 二、BLEU方法及分析 2、BLEU方法性能分析 各种匹配条件下BLEU-4得分与人工评价得分相关系数 二、BLEU方法及分析 2、BLEU方法性能分析 4个参考译文时与人工评价的相关性较好; 按字计算时与人工评价的相关性较好; 无论是按字匹配,按词匹配,按词性匹配,还是按词与词性同时匹配的, BLEU的相关性都仅在0.6-07之间 二、BLEU方法及分析 2、BLEU方法性能分析 平均对待任何译文不符合人工翻译评价的直觉 不区分译文的种类:实词、虚词、还是标点符号 一个正确的名词译文 vs 一个正确介词译文 不区分一个正确译文译出和连续多个正确译文 获得连续正确译文的难度要比获得一个正确译文的难度要大 对于手工评价,连续正确译文给人重要的正面印象。 三、基于线性回归的BLEU方法改进 1、基于词类的译文权重 首先引入词性信息 考察不同词性的正确译文和人工翻译评价结果之间的关系 各种词性正确译文与人工评价的相关系数(Pearson) 三、基于线性回归的BLEU方法改进 1、基于词类的译文权重 回归分析每种词性的权重: 引入权重前后BLEU-1得分和人工评分的相关性: 三、基于线性回归的BLEU方法改进 1、基于词类的译文权重 对词性加权后,各种情况与人工评价的相关性都相对于BLEU有了很大的提升 8种词性计算得分与人的评价得分的相关系数最高:0.77 三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算 将词性权重赋予不同长度的N-gram? 在N1时, N-gram会发生2种情况: 词与词性完全匹配 不完全匹配:词匹配但词性未得到匹配 初步分析: 仅考虑词与词性完全匹配二元(bigram) 的实验 三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算 三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算 在计算N-gram权重应该对所匹配上的词乘以一个权值,考虑到可能由于词性标注误差而造成的不完全匹配对,我们这里做一个近似的处理,将词形匹配而词性不匹配的词的权重乘以一个惩罚因子0.5。3元以及3元以上情况计算方法与此类似。 采用这种方法计算的N-gram得分和传统的BLEU得分与人工评价的相关性见下表: 三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算 三、基于线性回归的BLEU方法改进 3、N-gram译文分值权重 对BLEU1~BLEU4分值的权重再次回归分析; 根据回归纷纷的权重再计算BLEU-4: 加权N-gram得分和人工评分的相关系数:0.780 原始BLUE-4:0.620 (词和词性) 原始BLEU-4最高:0.68 (字) 四、实验结果与分析 基于词性和n-gram长度的BLEU方法性能分析 10重交叉交验结果 最高:0.934 最低:0.635 平均值:0.782 四、实验结果与分析 机器翻译自动评价性能实验 利用互联网上的机器翻译服务,获得12个不同翻译; 请同一翻译专家对这12系统译文进行评分; 并采用上文152篇数据得到的词性和N-gram的权重; 结语 总结 提出综合加权的BLEU方法,提高了和人工翻译评价的一致性。 不同译文词性 不同译文长度 在英汉机器翻译结果上的验证了这一方法的性能
您可能关注的文档
- 勾股定理的证明(比较全的证明方法).ppt
- 四年级科学教学计划.doc
- 四年级简便运算试题.doc
- 勿删高二化学测试题.doc
- 四年级英语上册期末夺冠一百参考答案文稿.ppt
- 化学与社会测试题.doc
- 四年级语文下册《沙漠中的绿洲》教学设计.doc
- 化学分子的立体结构课件.ppt
- 四年级语文下册第八单元教学案.doc
- 化学反应及能量的变化.ppt
- 云南省昭通市第一中学2025-2026学年高二上学期开学考试数学试题含答案.doc
- 2025-2026学年高一上学期开学(分班)测试数学试题+答案.doc
- 安徽省宣城市2024-2025学年高二下学期期末调研测试英语试卷(含答案).doc
- 安徽省宣城市2024-2025学年高二下学期期末考试 地理 含答案.doc
- 安徽省宣城市2024-2025学年高二下学期期末考试 生物 含答案.doc
- 江淮十校2026届高三第一次联考化学试卷(含答案解析).doc
- 广东衡水金卷2026届高三年级8月份联考语文试卷(含答案及解析).doc
- 江淮十校2026届高三第一次联考生物试卷(含答案解析).doc
- 安徽江淮十校2026届高三第一次联考(8月)数学试题+答案.doc
- 浅谈烟草行业县级局(分公司)如何贯彻实施保密工作.doc
最近下载
- 统编版小学道德与法治三年级上册1.1《学习伴我成长》第二课时 教学课件(共22张PPT)(内嵌音频+视频).pptx VIP
- 奔图 Pantum CP2500DN智享版、CP2510DN、CP2515DN维修手册.pdf VIP
- 铭记历史,砥砺前行++-2025-2026学年高一上学期纪念抗战胜利80周年主题班会.pptx VIP
- 设备采购供货安装投标方案.docx VIP
- 2025年人教PEP版(2024)小学英语四年级上册(全册)教学设计(附目录).docx
- 苏教版数学4年级上册全册同步课件.pptx
- 《思想道德与法治》课件——第一章 领悟人生真谛 把握人生方向.pptx VIP
- 0502-烹饪(西式烹调)专业国家技能人才培养工学一体化课程设置方案(试用).docx VIP
- 《机械装调技术》课件 模块五 整机调试与运行任务二 同步带传动机构的检测与调整.ppt VIP
- 排水工程关键工序及重、难点分析与对策.docx VIP
文档评论(0)