基于软件构件的机器翻译研究方法-中科院计算所自然语言处理研究组.DOC

基于软件构件的机器翻译研究方法-中科院计算所自然语言处理研究组.DOC

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于软件构件的机器翻译研究方法* * 本项研究受国家八六三项目基金资助 刘 群 张 祥 (中国科学院计算技术研究所二室 北京100080) 摘 要:机器翻译系统的研究开发工作是十分艰巨的。为了减轻开发的工作量,提高代码的可重用性,我们采用面向对象的方法,设计并实现了一个通用机器翻译开发平台。该平台提供了一系列的软件构件,这些软件构件实现了机器翻译中很多常用的数据结构和算法。该平台不依赖于具体的机器翻译系统和语法理论体系,可以用于构造不同类型的机器翻译系统。 关键词:机器翻译 软件构件 面向对象方法 A Software Component Approach to Machine Translation Liu Qun Zhang Xiang (Institute of Computing Technology, Chinese Academy of Science) Abstract: It is arduous to develop a machine translation system. In order to reduce the work and make the code more reusable, we develop a General Development Platform for MT System based on the object-oriented method. The platform provides a series of software components, which implement many common data structures and algorithms in the MT field. The platform is independent of specific MT systems and grammar theories. Thus it can be used to build different kinds of MT systems. Keyword: Machine Translation, Software Component, Object-Oriented Approach 一、前言 机器翻译系统的研究开发工作是十分艰巨的,研究工作者往往要在系统的具体编程实现上花费大量的时间精力,而很难将主要精力集中到所研究的内容上。 专用的知识描述语言的出现,是机器翻译研究中的一大进步[1],使得语言工作者在算法相对固定的情况下,可以直接描述机器翻译所用到的各种知识,而不必考虑程序实现上的各种细节。语言工作者可以专注于他们所熟悉的语言问题,而不再需要了解过多的程序知识。 然而,开发一个机器翻译系统仍然是一件非常艰巨的工作。由于机器翻译所固有的复杂性,软件开发者需要对机器翻译的每一方面的所有细节都有较为深入的了解。另外,由于工作量巨大,开发一个机器翻译系统往往需要大量的人力、物力的投入,以及财力的支持。这也使得很多研究工作者对机器翻译的研究望而却步。 我们认为,存在以上问题的一个重要原因,就在于机器翻译研究中使用的软件代码的可重用性太低。每个机器翻译研究小组都需要编制自己的一套程序,而这套程序不仅不能为其他小组的研究人员所使用,甚至同一小组中,也只有少量编程人员能掌握这套程序,其他人即使有什么好的想法,也很难编制出相应的程序来进行实验。当已有的系统不能满足实际工作的要求,需要对系统的能力进行扩充时,当我们需要尝试某种新的语法体系,或改变翻译的源语言或目标语言时,我们仍然面临着大量修改程序的艰巨任务。所有这一切,都严重地影响了人们对机器翻译的研究热情,阻碍了机器翻译研究工作的发展。 其实,现代程序技术的进步,面向对象的理论与技术的成熟,已经为解决代码重用的问题提供了有效的手段[2,3,4]。例如Microsoft公司的MFC类库和Borland公司的OWL类库,使得任何一个初级的编程人员都可以在Windows环境下轻松地编写出漂亮的用户界面程序[5]。类似地,我们希望构造一个通用的机器翻译开发平台,使机器翻译研究工作者不再为繁重的编程工作所困扰,而能够专注于他们所研究的问题。 二、软件构件方法 软件构件方法的出现,得益于面向对象理论的发展和技术的成熟。各种面向对象的编程语言的推广使用,使得提供软件构件的做法成为可能。 我们这里所说的软件构件,就是指将一组数据结构与算法封装在一起,以类库的形式提供给用户使用,用户只需通过给定的接口来访问该构件,而无须了解构件内部的具体实现方式。通过继承和重载等手段,用户还可以改变该构件的行为,或增加新的功能。 依据这一设想,我们设计并实现了一个基于软件构件的“通用机器翻译系统开发平台”,该平台具

您可能关注的文档

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档