基于译文加权的LEU改进方法.pptVIP

下载本文档

3
0
约3.07千字
约 24页
2018-08-29 发布于江苏
举报
版权申诉

基于译文加权的LEU改进方法.ppt

1、本文档共24页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于译文加权的LEU改进方法

基于译文加权的BLEU改进方法杨沐昀哈尔滨工业大学计算机学院机器智能与翻译研究室内容提要引言 BLEU用于汉语译文性能的实证分析基于线性回归的BLEU改进实验与分析一、引言 BLEU:机器翻译自动评价方法基于N-gram精确率 2002年IBM提出目前采用最广泛忽略译文的个性信息词性、连续正确译文长度基于译文加权BLEU改进二、BLEU方法及分析 1、传统的BLEU方法基本n-gram精确率公式: 二、BLEU方法及分析 1、传统的BLEU方法引入惩罚因子后，最终的BLEU计算公式如下所示：其中Wn是n元短语的权重，这里通常取Wn =1/N；N是取得最大的n元短语的元数，这里通常取 N=4 。这样的BLEU的得分是一个0-1之间的数，较高的得分表示译文质量越高。接近1的得分表示候选译文和参考译文就已经非常接近了。二、BLEU方法及分析 2、BLEU方法用于汉语译文性能分析数据：某英语水平考试英汉翻译试题 1段英文、3个句子 1个标准译文+3个手工译文 152篇翻译，阅卷点正式评分满分：12分二、BLEU方法及分析 2、BLEU方法性能分析各种匹配条件下BLEU-4得分与人工评价得分相关系数二、BLEU方法及分析 2、BLEU方法性能分析 4个参考译文时与人工评价的相关性较好；按字计算时与人工评价的相关性较好；无论是按字匹配，按词匹配，按词性匹配，还是按词与词性同时匹配的， BLEU的相关性都仅在0.6-07之间二、BLEU方法及分析 2、BLEU方法性能分析平均对待任何译文不符合人工翻译评价的直觉不区分译文的种类：实词、虚词、还是标点符号一个正确的名词译文 vs 一个正确介词译文不区分一个正确译文译出和连续多个正确译文获得连续正确译文的难度要比获得一个正确译文的难度要大对于手工评价，连续正确译文给人重要的正面印象。三、基于线性回归的BLEU方法改进 1、基于词类的译文权重首先引入词性信息考察不同词性的正确译文和人工翻译评价结果之间的关系各种词性正确译文与人工评价的相关系数(Pearson) 三、基于线性回归的BLEU方法改进 1、基于词类的译文权重回归分析每种词性的权重: 引入权重前后BLEU-1得分和人工评分的相关性: 三、基于线性回归的BLEU方法改进 1、基于词类的译文权重对词性加权后，各种情况与人工评价的相关性都相对于BLEU有了很大的提升 8种词性计算得分与人的评价得分的相关系数最高：0.77 三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算将词性权重赋予不同长度的N-gram？在N1时， N-gram会发生2种情况：词与词性完全匹配不完全匹配：词匹配但词性未得到匹配初步分析：仅考虑词与词性完全匹配二元(bigram) 的实验三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算在计算N-gram权重应该对所匹配上的词乘以一个权值，考虑到可能由于词性标注误差而造成的不完全匹配对，我们这里做一个近似的处理，将词形匹配而词性不匹配的词的权重乘以一个惩罚因子0.5。3元以及3元以上情况计算方法与此类似。采用这种方法计算的N-gram得分和传统的BLEU得分与人工评价的相关性见下表：三、基于线性回归的BLEU方法改进 2、N-gram译文分值的计算三、基于线性回归的BLEU方法改进 3、N-gram译文分值权重对BLEU1~BLEU4分值的权重再次回归分析；根据回归纷纷的权重再计算BLEU-4：加权N-gram得分和人工评分的相关系数：0.780 原始BLUE-4:0.620 （词和词性）原始BLEU-4最高：0.68 （字）四、实验结果与分析基于词性和n-gram长度的BLEU方法性能分析 10重交叉交验结果最高：0.934 最低：0.635 平均值：0.782 四、实验结果与分析机器翻译自动评价性能实验利用互联网上的机器翻译服务，获得12个不同翻译; 请同一翻译专家对这12系统译文进行评分; 并采用上文152篇数据得到的词性和N-gram的权重; 结语总结提出综合加权的BLEU方法，提高了和人工翻译评价的一致性。不同译文词性不同译文长度在英汉机器翻译结果上的验证了这一方法的性能