- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器翻译译文质量评价的实践与分析
机器翻译译文质量评价的实践与分析
作为一家新型的大型专业翻译公司,随你译拥有中国首屈一指的翻译资源。通过3年的积累,已经拥有多达6万名专业注册译者,可以翻译56种语言,42个行业。大量的高素质译者保证我们可以给您提供最熟悉您行并业的专才译者队伍,通过我们卓有成效的管理体系,从而提供一个比同类公司在便捷、高质、价优、可信方面更为出色的翻译服务。
1则要用没。
(3)省略成分的补足
例12.He studies physics and Ichemistry.
汉语译文应该是他学物理而我学化学。后一个学字是必须补上的。MTE出了9个这样的句子,只有第2套译文T2处理得好,对了8个,T1与T3都没做对。
3.5语义测试随你译itle=翻译公司href=翻译公司
第2节介绍的多义词就是测试语义的,介词短语的多义在MTE中也作为句法中的一个中类的测试点。又如,
例13.flying planes is dangerous.
例14.flying planes are dangerous.
例13中的flying planes是述宾结构,flying应译成驾驶;例14中的flying planes是定中结构,flying应译成正在飞的。T1,淘美网T2,T3将这两句英语都译成相同的汉语,可见这3个MT系统都还没有根据句子中谓语动词的形态(is或are)正确处理这种同形异构多义的能力。
例15.It ha淘美网s stopped raining.
例16.Lets stop to rest.
虽然这两句中的stop都是停止的意思,但全句的意思却大相径庭。MTE也要测试MT的译文能否反映它们之间的差别。
由此可见,MTE虽然未将语义测试单独列为测试点,但在词法、句法的测试中也融合了语义的测试。当然,语义测试的内容十分丰富,MTE的语义测试尚有待强化。
四.机器翻译评价的研究课题
恰当地评价MT可以正确估计陈海阳律师团队MT的发展水平,可以为以下3方面的人提供重要的决策依据:
(1)MT的最终用户考虑的是如何选择适合自己需要的系统,(2)MT的研究者考虑的是如何确立新的MT系统的理论模型及技术路线,(3)实用型MT系统的开发者最关心的是如何估计模型系统的发展潜力以及它能否满足特定用户的需要。由于MT系统的运用除了受机器生成的译文的质量这一因素制约外,还受到系统运行的环境、用户自身素质等诸多因素的影响,主观评价与应用效果之间往往会有不小的差距。如果考虑到翻译工作是语言文字信息处理全过程(检索、识别、输入、前编辑、翻译、后编辑、输出、排版、印刷、远程通讯等)中的一个环节,那么更合理的评判准则应该是统一的生产率观点,即MT是否提高了全过程的效益。因此,需要评价的内容以及参加评价的人员都是多方面的[7]。在日本,就分别为用户、开发者以及译文质量分别制定了评价标准[15,16,17]。专门从事MT评价的研究者所能完成的只是其中一部分工作。笔者认为,MT评价的专门研究以译文质量作为主要关心的对象比较适宜。
MTE为机译译文质量的自动评测奠定了一个很好的基础,但需要进一步研究与开发的课题还很多,当前考虑到的有以下几个方面。
1.扩充测试集的规模。目前MTE的题库只有3300句,无法排除MT系统开发者只用这个测试集对系统进行训练的可能性。计划将这个测试集扩充到1万句左右,并且全面覆盖英汉翻译的各种语言现象,这样就可以做到测试集全部公开。实际比如未来评测时,不一定每次都要MT系统将一万句全部翻译出来,可以随机(按类)挑选其中的1/4到1/3进行测试。由于不同系统会有不同的适用领域,通用的测试集和测试点应该集中在任何一个有实际价值的MT系统都必须解决的那些问题上。换句话说,如果用这个通用的测试集去测试某个机译系统,该系统的成绩很差,却自称它对某某领域是适用的,人们就很难相信这种说法的可靠性。
2.调整与扩充测试点,使测试点的分布更加全面,更加合理。不仅给大类的得分赋以权重,在中类、小类之间也可以考虑加权。或者根据测试点在实际语料中的出现频度决定其在测试集中的出现频度。
3.改进MTE系统的界面与算法,使MTE更加好用,评测速度更快,结果显示更加一目了然。特别有意义的是实现联机测试,将MT输出的结果直接送入MTE进行测试,这样可以实现多个MT系统的现场评测。
4.开展标准化研究,建立可以实际实施的机器翻译译文质量评测标准。
5.开展新陈海阳律师团队的评价方法的研究,如对整个句子的翻译质量的评价以及对基于上下文理解的篇章翻译的质量的评价。
6.扩充语言对。虽然MTE的原理与设计是独立于具体的语言对的,但测试集却是需要针对不同的语言对分别进行开发的。近期的目标是开发日汉机器翻译和汉英机器翻译的测试集。
五.后记
正在进行的此项研究得到中国国家自然科学基金的支持(项目号为
您可能关注的文档
最近下载
- 防范青少年药物滥用.pptx VIP
- 2025年广西专业技术人员继续教育公需科目(二)答案.docx VIP
- 执业药师继续教育《泌尿系统感染的药物治疗》习题答案.docx VIP
- 第14课中国共产党诞生 课件.pptx VIP
- 测量系统分析MSA模板(GRR+线性+偏倚+稳定性+计数型)-全公式未加密.xlsx
- 检验科临检组管理程序性SOP文件.doc VIP
- T∕ZZB 1912-2020 多层片式陶瓷电容器电极镍粉.pdf VIP
- 预制菜行业调研分析报告.docx VIP
- 神经内科诊疗指南-技术操作规范.pdf VIP
- APQP4Wind Manual 1.3 APQP4手册1.3 最新标准分享.pdf VIP
原创力文档


文档评论(0)