日汉机器翻译系统中的多Agent的研究.pdfVIP

  • 7
  • 0
  • 约1.07万字
  • 约 6页
  • 2017-08-14 发布于安徽
  • 举报
日汉机器翻译系统中的多Agent研究 张捷陈群秀 智能技术与系统国家重点实验室清华大学计算机科学与技术系-北京100084 Emai】:丑勘鲥磅9匡雌幽出皿。扎∞ 摘要:机器翻译系统提高译文质量是一个关键性的难题.本文探讨如何在多方法的机器翻译 系统中引入多Agent组织结构,并提出一种多层次多Agent组织结构一类工程组织结构,使用 登记表通讯策略.该组织结构应用在多翻译方法的日汉MTS申,使翻译质量有了较大的改善。 关键词:多Agent,类工程组织结构,登记表通讯策略,日汉机器翻译 引言 机器翻译的发展经历了很长的时间,单—韶译策略的机器翻译系统已经越来越难以取得进展。机器 翻译的发展趋向—个多分析方法,多语言模型的方向。然而如何把这些分析方法和语言模型协调综台起 来.使得综合处理的效果要好于每一个分析方法和语言模型的处理效果就成为一个研究的课题。 目前很多机器翻译系统都用开始采用引入其它领域的人工智能的方法来改善自己的系统,如 Ⅲ系统与其他翻译系统不同的是它有3个翻译引擎。—个是基于知识的翻译引擎.为主引擎,还有基于 实例的翻译引擎和词汇转换引擎。每个引擎都试图翻译整个或部分输入源语,由系统综合评价各引擎的 输出,最后系统输出总体最好结果。这样显然有利于排除具体方法的不足。州jR∞也提出了一种多引 擎的机器翻译,采用集中控制器控制,各个翻译方法独立翻译,最后取评分最好的结果[5】[6】。在结构组 织上有采用串行结构的,也有采用并行结构的。然而引入在理论上已经发展的比较成熟的多Agent组织 结构来进行组织协调的研究还相对是一个空白。 我们的日汉机器翻译系统经过多年的研制,已经有了丰富的资源和成果。系统包括分词系统,基于 配价横_式、格语法和语义分类的混合模型方法、基于实例的翻译方法和基于断段分析翻译方法。本文提 出—种多层次的多A霉erII组织结构一类E隧丑织结构,井使用登记莉自谓藻略。在系统中应用I}l::组2H结 构,取得了比较好的效果。 1.总体设计 1.1.问题分析 系统中已经有了分词系统和三种翻译方满2]。 基孺E价模式、槲捌杰和语义分类的混合模型方法采用动词配价模式和格语法的混合方法,再加上 将体词进行语义分类,就能解决动词多义选择,助词多义选择、甚至某些体词同形多义、同音异形问题 【l】。但l}匕=撇模式的覆盖面E存在着缺点,模式主要面向的是动词的匹配,而对句子中大量出现的使 用灵活的助词则不可能在动词模式中全部列出。这个翻译方法在三种翻译方法中是效果最好,资源最多, 最成熟的一个。 基于实例的翻译方法是基于语料库的翻译方法的其中一种。这个翻译方法的特点在于一旦能够在实 例库中找到相似度够高的实例,翻译的结果就相当的准确。然而相反的,如果找不到相似度够高的实例, 就基本翻译不出来。 “断段分析翻译方法”最初是由孙国钦在《速成科技日语》一书中作为—种学习方法提出来的,其 核心思想是根据日语自身的特点,利用日语中助词、助动词的语法功能,把日语句子切分成小段,然后 进行分段分析和生成,最终再合成整恂子的译文,即化难为易地进行翻译。这个方法的特点是翻译的 覆盖面相对础模式更自旷一。这个方罐对于简单旬的翻译效果比较好,丽处理复5精况的能力比较有 限。 问题的关键就在于如何把这三种翻译方法根据它们各自的特点组织起来,但对它们又要有所区别的 对待,同时还考虑到组织结构的通用性和可扩展性,我们决定引入在理论上已经发展的相对成熟的多 Agent缨织结构来组织协调我们的翻译方法。我们根据各种多A脚t组织结构的组织和通讯方法提出了 +种类T‘程绍织结构和登记表通讯策略。 1.2.总体设计 在总体设计上我们考虑到翻泽方法的不平等性,在组织结构E采取了多层次的策略,并通过登记表 i拄彳}多个A卿之间的通讯。多层次倥孺不同的甜泽方法可以充分发挥自己自啭点丽避免了平等静g下 可能导致的翻译方法的优点没有得到体现.反而翻译结果的质量下降。 考虑到通用性,我们在组织结构的设计上应该独立于翻译方法和翻译语种,使得不同的机器掰译系 统都可以采用这样的多A圆弧组织结构。并在I比基础E进行扩展。考虑蛩阿扩展牲,我”语期织结构的 没计啦该采用相对灵活的设计,在翻译方法的添加、丢弃和替换E有着充分的灵活性。同时我们的组 织结构对于多机的并行计算也麻该有着良好的可扩展性。考虑到

文档评论(0)

1亿VIP精品文档

相关文档