自动评价机器翻译译文质量的一种方法.pdfVIP

自动评价机器翻译译文质量的一种方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
石油、天然气工业

维普资讯 大 庆 石 油 学 院 学 报 第 28卷 第 3期 2004年 6月 JOuRNALOFDAQING PETROIEUM INSTITUTE VoI.28 No.3 Jun. 2004 自动评价机器翻译译文质量的一种方法 尚福华 ,王宏威 ,黄 真。 (1.大庆石油学院 计算机科学与工程学院,黑龙江 大庆 163318; 2.大庆石油学院 学校办公室 黑龙江 大庆 163318) 摘 要:针对机器翻译译文质量的评价存在人工评价成本高,可重用性差的问题,提出了采用 BLEU方法代替人工 评价.分析了BLEU方法对汉语译文评价的效果.根据汉语的特点 ,做了汉字模型和词模型的评价实验 ,比较了人工评 价和BLEU方法评价效果 ,结果表明,基于BLEU的词模型的性能好于汉字模型. 关 键 词:BLEU方法;译文评价;字模型;词模型 中图分类号 :TP391.2 文献标识码 :A 文章编号:1000—1891(2004)03—0057—03 机器翻译系统评价的方法可归纳为 3种类型:(1)操作性评价 ,即从经济角度评价机器翻译系统 ,主要 分析机器的成本和开销-[13;(2)描述性评价,即根据忠实性、准确性等标准,评价译文的质量 ;(3)分类评价 , 即记录发现的错误,并归类,分类评价机译系统中语言处理的弱点.机器翻译系统中具有代表性 的2个系 统是 Thompson实验系统和北京大学MTE系统_l2].近年来,机器翻译 自动评价方面的研究较热_l3].2002 年美国国家标准与技术研究所采纳 IBM公司提出的基于词的N元模型的评价方法 (BLEU方法),该方 法的基本思路是质量较好的机器译文和人工译文有更多相同的词汇及句子片段.BLEU方法简洁明了, 并且和人工评分有很强的相关性.笔者尝试将 BLEU方法从英语译文评价推广到汉语译文的评价 ,分析 了BLEU方法在英汉翻译中的使用效果. 1 BLEU 方法 BLEU方法的基本思想 :机器译文越是接近专业翻译人员的翻译 ,其译文质量就越好.笔者参照给 定的高质量人工译文,让机器 自动地获取翻译知识 ,给机器翻译的译文句子 “打分”.根据 BLEU方法,给 出任意 1个句子和整段文本的BLEU值 ,作为评估机器翻译系统的重要参数.BLEU形式化如下 : 假设 1个句子 S可以被切分成 1个词序列,记作 S一 。硼:…W ,其中W 为词典中的 1个词,令 一 WjW+-…硼 ,则句子 S一叫 .称词串 (1≤i≤i+是一1)为 1个 元词,句子 S中 元词为k— +1 个.在计算精度时,根据 取值的不同,进行 元词的匹配.由此得到了句子 元BLEU分数 的计算 公式: V一B ·exp(∑WInP), (1) 或 InVn—min(卜 ,0)+ , (2) P 一 C /c ; (3) B 一 一』 , (4) , f≤ r. 式中:B 为句子过短的判罚因子;r为有效句子长度;c为候选译文长度;C 为候选译文与参照译文匹配 收稿 日期 :2003—10—30;审稿人:许少华 ;编辑:陆雅玲 作者简介:尚福华(1962一),男 .副教授 .从事人工智能和文本评价方面的研究 维普资讯 大 庆 石 油 学 院 学 报

文档评论(0)

fengbing + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档