2025年BLEU评分专项训练.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年BLEU评分专项训练

考试时间:______分钟总分:______分姓名:______

一、

简述BLEU评分的基本原理,包括其主要衡量指标、计算公式中的关键组成部分(如n-gramprecision,brevitypenalty,geometricmean)及其作用。

二、

假设你有以下机器翻译输出和两个参考翻译:

机器翻译输出:Thecatsatonthemat.

参考翻译1:Acatsitsonthemat.

参考翻译2:Thecatissittingonmat.

请手动计算该翻译的BLEU-4得分。计算过程中需要明确列出1-gram,2-gram,3-gram,4-gram的precision值,计算brevitypenalty(BP),并最终得到BLEU-4分数。假设n-gram匹配不考虑词序。

三、

BLEU评分的brevitypenalty(BP)项起到了什么作用?请解释当机器翻译输出比所有参考翻译都短时,BP是如何调整最终的BLEU分数的。

四、

讨论BLEU评分作为一种机器翻译自动评测指标的主要优点。请至少列举三点。

五、

指出BLEU评分在衡量机器翻译质量方面存在的至少三点局限性或缺点。

六、

在实际应用BLEU评分评测机器翻译系统时,可能会遇到参考翻译质量不高的问题。这种情况会对BLEU分数产生什么影响?请说明原因。

七、

除了BLEU之外,你还了解哪些用于评测机器翻译质量的其他指标或方法?请简要说明其中一种与BLEU相比的主要区别。

八、

随着机器翻译技术的发展,评测方法也在不断进步。请结合“2025年”这一时间背景,谈谈你对未来机器翻译评测趋势的看法,特别是在超越传统BLEU评分方面,可能出现哪些新的评测方向或指标。

试卷答案

一、

BLEU评分是一种基于n-gram匹配的机器翻译自动评测指标。其基本原理是比较机器翻译输出与一组参考翻译之间的相似度。主要衡量指标包括:

1.n-gramPrecision:计算机器翻译输出中与参考翻译完全匹配的n-gram(n-gram是指连续的n个词)的比例。通常计算1-4-gram的precision,并取所有参考翻译中对应n-gramprecision的最小值。

2.GeometricMean:将所有n-gram(1-gram到4-gram)的最小precision值进行几何平均,得到未经惩罚的BLEU分数。

3.BrevityPenalty(BP):由于机器翻译输出的长度通常与参考翻译长度不同,BP项用于惩罚那些显著短于所有参考翻译的输出。它反映了由于长度不足而丢失的信息量,通常采用BP=min(1,(ref_length/hyp_length)^c)的形式,其中ref_length是参考翻译长度的平均值,hyp_length是机器翻译输出长度,c是一个常数(通常为0.35)。

最终BLEU分数=GeometricMean*BP。BLEU分数越高,通常表示机器翻译输出质量越好。

二、

计算过程:

1.分词:将所有文本切分成单词。

输出:[The,cat,sat,on,the,mat.]

参考1:[A,cat,sits,on,the,mat.]

参考2:[The,cat,is,sitting,on,mat.]

2.计算1-gramprecision:

输出1-grams:{The,cat,sat,on,the,mat.}

参考11-grams:{A,cat,sits,on,the,mat.}

参考21-grams:{The,cat,is,sitting,on,mat.}

最小匹配:{cat,on,the}(共3个)

1-gramPrecision=3/6=0.5

3.计算2-gramprecision:

输出2-grams:{Thecat,catsat,saton,onthe,themat.}

参考12-grams:{Acat,catsits,sitson,onthe,themat.}

参考22-grams:{Thecat,catis,issitting,sittingon,onmat.}

最小匹配:{catsat,onthe}(共2个)

2-gramPrecision=2/5=0.4(注意:输出总词数为6,所以最大2-gram

文档评论(0)

ShawnLAU + 关注
实名认证
文档贡献者

人力资源管理师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月26日上传了人力资源管理师

1亿VIP精品文档

相关文档