- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于软件构件的机器翻译研究方法*
* 本项研究受国家八六三项目基金资助
刘 群 张 祥
(中国科学院计算技术研究所二室 北京100080)
摘 要:机器翻译系统的研究开发工作是十分艰巨的。为了减轻开发的工作量,提高代码的可重用性,我们采用面向对象的方法,设计并实现了一个通用机器翻译开发平台。该平台提供了一系列的软件构件,这些软件构件实现了机器翻译中很多常用的数据结构和算法。该平台不依赖于具体的机器翻译系统和语法理论体系,可以用于构造不同类型的机器翻译系统。
关键词:机器翻译 软件构件 面向对象方法
A Software Component Approach to Machine Translation
Liu Qun Zhang Xiang
(Institute of Computing Technology, Chinese Academy of Science)
Abstract: It is arduous to develop a machine translation system. In order to reduce the work and make the code more reusable, we develop a General Development Platform for MT System based on the object-oriented method. The platform provides a series of software components, which implement many common data structures and algorithms in the MT field. The platform is independent of specific MT systems and grammar theories. Thus it can be used to build different kinds of MT systems.
Keyword: Machine Translation, Software Component, Object-Oriented Approach
一、前言
机器翻译系统的研究开发工作是十分艰巨的,研究工作者往往要在系统的具体编程实现上花费大量的时间精力,而很难将主要精力集中到所研究的内容上。
专用的知识描述语言的出现,是机器翻译研究中的一大进步[1],使得语言工作者在算法相对固定的情况下,可以直接描述机器翻译所用到的各种知识,而不必考虑程序实现上的各种细节。语言工作者可以专注于他们所熟悉的语言问题,而不再需要了解过多的程序知识。
然而,开发一个机器翻译系统仍然是一件非常艰巨的工作。由于机器翻译所固有的复杂性,软件开发者需要对机器翻译的每一方面的所有细节都有较为深入的了解。另外,由于工作量巨大,开发一个机器翻译系统往往需要大量的人力、物力的投入,以及财力的支持。这也使得很多研究工作者对机器翻译的研究望而却步。
我们认为,存在以上问题的一个重要原因,就在于机器翻译研究中使用的软件代码的可重用性太低。每个机器翻译研究小组都需要编制自己的一套程序,而这套程序不仅不能为其他小组的研究人员所使用,甚至同一小组中,也只有少量编程人员能掌握这套程序,其他人即使有什么好的想法,也很难编制出相应的程序来进行实验。当已有的系统不能满足实际工作的要求,需要对系统的能力进行扩充时,当我们需要尝试某种新的语法体系,或改变翻译的源语言或目标语言时,我们仍然面临着大量修改程序的艰巨任务。所有这一切,都严重地影响了人们对机器翻译的研究热情,阻碍了机器翻译研究工作的发展。
其实,现代程序技术的进步,面向对象的理论与技术的成熟,已经为解决代码重用的问题提供了有效的手段[2,3,4]。例如Microsoft公司的MFC类库和Borland公司的OWL类库,使得任何一个初级的编程人员都可以在Windows环境下轻松地编写出漂亮的用户界面程序[5]。类似地,我们希望构造一个通用的机器翻译开发平台,使机器翻译研究工作者不再为繁重的编程工作所困扰,而能够专注于他们所研究的问题。
二、软件构件方法
软件构件方法的出现,得益于面向对象理论的发展和技术的成熟。各种面向对象的编程语言的推广使用,使得提供软件构件的做法成为可能。
我们这里所说的软件构件,就是指将一组数据结构与算法封装在一起,以类库的形式提供给用户使用,用户只需通过给定的接口来访问该构件,而无须了解构件内部的具体实现方式。通过继承和重载等手段,用户还可以改变该构件的行为,或增加新的功能。
依据这一设想,我们设计并实现了一个基于软件构件的“通用机器翻译系统开发平台”,该平台具
您可能关注的文档
- 基于不同奖惩机制项目支付进度优化双重视角.PDF
- 基于专业质量标准创建多元协同培养动物科学人才模式-中国农业教育.PDF
- 基于互相关函数的单孔法波速测试优化算法-岩土力学.PDF
- 基于亮度和对比度模型的图像融合质量评价标准.PDF
- 基于人类需求的生态系统服务分类-中国科学院.PDF
- 基于光纤到户的智能互动用电技术研究与应用.PDF
- 基于云聚类挖掘的物流信息智能分析方法研究-情报资料工作-中国.PDF
- 基于农户尺度的农业旱灾脆弱性综合评价-华中农业大学学报.PDF
- 基于全能量比较的城供暖方式能源利用率评价-河北科技大学学报.PDF
- 基于分布式电源的配电网综合效益评价-上海电力学院学报.PDF
- 基于计划行为理论的竞争驾驶行为建模0-交通运输系统工程与信息.PDF
- 基于通信相似度的僵尸网络节点检测方法Methodofbotnetnetwork.PDF
- 基于遗传优化的采样模糊C均值聚类算法.PDF
- 基于隐马尔可夫随机场的细胞分割方法-哈尔滨工程大学学报.PDF
- 基于非平稳相似性系数的构造导向滤波及断层检测方法.PDF
- 基于贝叶斯统计学习理论的高维空间多类别大样本量-visionouc.PPT
- 基于高次数据拟合OFDM系统快时变信道估计算法-计算机应用研究.PDF
- 基于高通量测序分析青藏高原特有植物蓝玉簪龙胆Gentiana.PDF
- 基于驾驶绩效的车载信息系统操作分心判定模型-中国公路学报-长安.PDF
- 基于随机评价机制的交互式双子群QPSO算法-控制与决策.PDF
文档评论(0)