- 4
- 0
- 约9.53千字
- 约 22页
- 2017-07-24 发布于江苏
- 举报
机器翻译自动评价十年
机器翻译自动评价十年
杨沐昀、赵铁军、朱俊国
哈尔滨工业大学计算机科学与技术学院
机器智能与翻译研究室
2012年9月,西安
前言
自动评价已成为机器翻译中的关键因素
自动评价为导向的MT建模
研究中采用多种自动评价指标验证成果
评测中使用多种自动评价指标考量性能
每年不断出现新的角度构建自动评价策略
某些情况下自动评价仍无法正确区分翻译质量
系统融合案例
提 纲
机器翻译自动评价研究概况
字符串相似度方法、机器学习方法
机器翻译自动评价的公开评测
分析型评价方法的出现
机器翻译自动评价中的挑战
语言学特征能否解决评价问题
用户选择什么样的译文
小结
机器翻译自动评价研究概况
基于字符串相似度方法
基于机器学习的多特征融合方法
机器翻译自动评价的评测实践
分析型评价的出现
基于字符串相似度的方法
“机器译文” 的自动评价出发点:
有多好 ( ×)
哪个更好 ( √)
评价性能度量:人工评价结果为标准
准确率 ( ×)
结果一致程度 ( √)
相关系数:Pearson, Spearman, Kendall’s Tau
不关心人工评价和自动评价具体分数
基于字符串相似度的方法
BLEU:(Papineni et al, ACL 2002/IBM TR 2001)
基于n-gram精确率的相似
度计算、简单、高效 Countclip(n gram)
Pn C{candidates} ngramC
系统级评价与人高度一致 Count(n gram)
句子级评价性能较差 C{candidates} ngramC
不区分词的差别 N
不区分n-gram的差别 BLEU BP expwn log p n
未考虑召回率 1
几何平均值
参考译文不完备 N=4 ,Wn =1/4
……
基于字符串相似度的方法
Metrics Type of 位置 Stem Word 精确 召回 F值 模型
Gram Net 率 率
NIST N- gram 内有序 —— —— √ —— —— 相似度
gram gram间无序
Rouge Skip- gram 内有序 —— —— —— √ —— 相似度
bigram gram间无序
——
您可能关注的文档
- 新移民家庭子女学习表现与因应对策调查计画成果.PDF
- 新生精神康复会石排湾综合培训中心.PDF
- 新移民子女教育议题融入多元文化课程之探讨.PDF
- 新移民手册-ScotiabankGlobalSite.PDF
- 新西兰旅客入境卡-NewZealandCustomsService.PDF
- 新西兰乳品(婴幼儿配方乳品除外)生产企业在华注.PDF
- 新移民报告.doc
- 新芳奈米科技.PDF
- 新闻稿2012香港中学文凭考试报考概况.PDF
- 方案简介圣天诺外壳技术(Envelope)——保护安.PDF
- (2026春新版)部编版八年级语文下册《第一单元》PPT课件.pptx
- 2018电力监控系统网络安全监测装置技术规范.docx
- 2022电力监控系统安全防护方案审核要点.docx
- 2014电力电缆光伏系统EN 50618欧标.docx
- (2026春新版)人教版二年级数学下册《第三单元 万以内数的认识》教案.docx
- (2026春新版)人教版二年级数学下册《第四单元 万以内的加法和减法》教案.docx
- (2026春新版)人教版二年级数学下册《综合与实践 时间在哪里》教案.docx
- (2026春新版)苏教版二年级数学下册《综合与实践 时间有多长》教案 .pdf
- (2026春新版)部编版三年级语文下册第3单元(教案).docx
- (2026春新版)部编版三年级语文下册第8单元(教案).docx
原创力文档

文档评论(0)