- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器翻译中规则和模板的协调方法研究*
孙广范 宋金平 袁琦
中国电子信息产业发展研究院, 北京 100044
E-mail: Morgan2001_sun@; Songjp@;
Yq@
摘要:本文讨论了机器翻译中的基于规则、基于翻译模板及转换模型的特点,分别比较了它们的优点和不足。同时讨论了协调基于模板方法与基于转换模型方法的合理途径。针对研制机器翻译系统的需要设计了将这几种方法有机地结合起来的算法。将本文提出的协调方法在汉英双向机器翻译系统中应用,取得了较好的实验结果。通过采用模板和去掉模板分别进行翻译实验,结果表明基于模板方法对于译文质量提高的贡献率分别为:口语为12%,篇章翻译为8%。
关键词:规则,翻译模板,转换模型,机器翻译
中图分类号:T391.2
Study on the Coordination Methods between Rules and Templates in Machine Translation
Sun Guangfan, Song Jinping, Yuan Qi
China Center for Information Industry Development, Beijing, 100044
E-mail: Morgan2001_sun@; Songjp@;
Yq@
Abstract: This paper discusses the features of rule-based methods, template-based methods and the transformation model in machine translation, and compares their advantages and disadvantages. A rational approach to coordinate the template-based method and the transformation model method is also discussed. The algorithm of combining the above methods has been designed in accordance to the need for the development of the machine translation systems. This coordination approach has been applied to bi-directional Chinese-English machine translation systems and has yielded satisfactory results empirically. By means of the experiment of translation with and without templates respectively, the result shows that the contribution rate for improving MT output by using the template-based method is 12% for oral English and 8% for written English.
Keywords: Rule, Translation Template, Translation Model, Machine Translation
引言
几十年来机器翻译的传统方法是理性主义的基于规则的方法,此方法在自然语言处理及机器翻译的应用中发挥了重要的作用,目前很多实用型机器翻译系统都是以基于规则方法为主的。基于规则方法的优点是覆盖面较宽。但是,由于人类语言的复杂性,由专家描述的规则抽象程度较高,知识颗粒度较大,在处理语言细节上经常犯错误,因而在处理大规模的开放语料时,往往难以提供高质量的译文。从八十年代后期开始兴起的经验主义的基于语料库的方法,为自然语言处理及机器翻译方法开辟了一条新路。基于语料库的机器翻译方法包括基于统计的方法和基于实例的方法。其主旨就是尽量让机器翻译系统模拟翻译专家的实践技能。翻译过程并非词对词、句对句的一一对应过程,而是包含复杂的生成转换模式,因而为所有可能实际出现的转换模式建立规则非常困难。因为单一的机器翻译方法很难达到预期的效果,所以将基于语料库的经验主义方法与基于规则的理性主义方法结合起来,已经成为国际上许多机器翻译研究者的共识。由于基于实例方法的需要维护一个大的实例库,并且在范围宽时完全匹配的概率不高,所以基于翻译模板的方法就显示出了优越性。本文将讨论在机器翻译系统中将基于规则的方法和基于模板的方法结合起
文档评论(0)