- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年BLEU评分专项训练
考试时间:______分钟总分:______分姓名:______
一、
简述BLEU评分的基本原理,包括其主要衡量指标、计算公式中的关键组成部分(如n-gramprecision,brevitypenalty,geometricmean)及其作用。
二、
假设你有以下机器翻译输出和两个参考翻译:
机器翻译输出:Thecatsatonthemat.
参考翻译1:Acatsitsonthemat.
参考翻译2:Thecatissittingonmat.
请手动计算该翻译的BLEU-4得分。计算过程中需要明确列出1-gram,2-gram,3-gram,4-gram的precision值,计算brevitypenalty(BP),并最终得到BLEU-4分数。假设n-gram匹配不考虑词序。
三、
BLEU评分的brevitypenalty(BP)项起到了什么作用?请解释当机器翻译输出比所有参考翻译都短时,BP是如何调整最终的BLEU分数的。
四、
讨论BLEU评分作为一种机器翻译自动评测指标的主要优点。请至少列举三点。
五、
指出BLEU评分在衡量机器翻译质量方面存在的至少三点局限性或缺点。
六、
在实际应用BLEU评分评测机器翻译系统时,可能会遇到参考翻译质量不高的问题。这种情况会对BLEU分数产生什么影响?请说明原因。
七、
除了BLEU之外,你还了解哪些用于评测机器翻译质量的其他指标或方法?请简要说明其中一种与BLEU相比的主要区别。
八、
随着机器翻译技术的发展,评测方法也在不断进步。请结合“2025年”这一时间背景,谈谈你对未来机器翻译评测趋势的看法,特别是在超越传统BLEU评分方面,可能出现哪些新的评测方向或指标。
试卷答案
一、
BLEU评分是一种基于n-gram匹配的机器翻译自动评测指标。其基本原理是比较机器翻译输出与一组参考翻译之间的相似度。主要衡量指标包括:
1.n-gramPrecision:计算机器翻译输出中与参考翻译完全匹配的n-gram(n-gram是指连续的n个词)的比例。通常计算1-4-gram的precision,并取所有参考翻译中对应n-gramprecision的最小值。
2.GeometricMean:将所有n-gram(1-gram到4-gram)的最小precision值进行几何平均,得到未经惩罚的BLEU分数。
3.BrevityPenalty(BP):由于机器翻译输出的长度通常与参考翻译长度不同,BP项用于惩罚那些显著短于所有参考翻译的输出。它反映了由于长度不足而丢失的信息量,通常采用BP=min(1,(ref_length/hyp_length)^c)的形式,其中ref_length是参考翻译长度的平均值,hyp_length是机器翻译输出长度,c是一个常数(通常为0.35)。
最终BLEU分数=GeometricMean*BP。BLEU分数越高,通常表示机器翻译输出质量越好。
二、
计算过程:
1.分词:将所有文本切分成单词。
输出:[The,cat,sat,on,the,mat.]
参考1:[A,cat,sits,on,the,mat.]
参考2:[The,cat,is,sitting,on,mat.]
2.计算1-gramprecision:
输出1-grams:{The,cat,sat,on,the,mat.}
参考11-grams:{A,cat,sits,on,the,mat.}
参考21-grams:{The,cat,is,sitting,on,mat.}
最小匹配:{cat,on,the}(共3个)
1-gramPrecision=3/6=0.5
3.计算2-gramprecision:
输出2-grams:{Thecat,catsat,saton,onthe,themat.}
参考12-grams:{Acat,catsits,sitson,onthe,themat.}
参考22-grams:{Thecat,catis,issitting,sittingon,onmat.}
最小匹配:{catsat,onthe}(共2个)
2-gramPrecision=2/5=0.4(注意:输出总词数为6,所以最大2-gram
原创力文档


文档评论(0)