汉英机译系统中上下文处理分析.pdf

V x J艿了9彳。 摘要 机器翻译的研究方兴未艾,虽然英汉机译系统的翻译质量还亟待提高,也 有不少系统已经进入实用阶段。汉英机译系统的研究还处于初步阶段,有更 多的问题需要深入研究。相对说来,分词的问题比较成熟,语法分析的研究 日益深入,语义处理的讨论也日益增多。另外.由于不同语言之间的差异, 它们之间的互译,不是简单的结构对应。例如,在汉英翻译系统中,要生成 较高质量的英文.还需要补足原先汉语中缺少的一些语言信息,比如时态信 息、名词特指属性、名词单复数属性等。这方面的工作非常有意义,但由于 先前的系统多局限于单旬的处理,这一领域暂时少有人问津。本文试图通过 上下文处理,解决汉英机译中存在的这些问题。f全文共分六章: 第一章:序言 通过对机器翻译发展的回顾,对现状的分析,指出了汉 英机译中存在的若干问题,从而提出本文的研究侧重点,并对本文的工作做 了大致说明。 第二章:句子时态的确定 汉语中缺乏时态的概念,在对单句的分析中. 经肯无法得到时态信息;只有补足这些信息,才能生成更加正确的译文。本 童讨论如何从上下文中寻找到句子正确的时态信息。 第三章:名词特指的处理 名词特指也是汉语区别于英语的一个特点, 要生成更具有可读性的英文,摄好还是把名词的特指信息补上。本章从语法 和上下文的角度,提出了确定特指的一些构想及其实现。 第四章:代词指代的处理 指代是语言中常见的表达方法。的确,并不 一定要完全确定代词所指代的对象,才能得到正确的译文。但是,指代现象 的处理有着重要的作用,有助于后续的上下文处理、确定单复数属性、确定 成分省略以及消解歧义等。本章讨论了确定代词指代的方法。 第五章:名词单复数的处理 名词单复数问题是汉英机译中最普遍,也 是最棘手的问题,对它的处理还没有比较成熟的方法,本章只简要介绍了如 何利用上下文确定名词的单复数。 第六章:结束语 总结本文的工作,并提出进一步改进的方向和设想。 另外,附录中给出了本系统采用的中间语言规范以及系统运行结果示例, 以供参考。∥ 关键词:机器翻译、上下文处理、中间语言、时态、指代、名词特指 汉英机译系统中上下文处理的研究 第一章序言 一、概述 2l世纪是信息的时代,数字化的时代。随着生活的信息化、计算机的普 及以及Internet的迅猛发展,人们每天要接触和处理的信息越来越多,利用计 算机对这些信息进行处理就成了时代发展的要求。因此,信息处理技术被摆 到了重要的位置上,目渐为人们关注。作为信息处理技术领域中最富有挑战 性的机器翻译技术(MachineTranslation,简称MT),一直吸引着众多的专家 和学者。 机器翻译的过程就是使用计算机对某种自然语言(源语言)的文本进行分 析处理,然后以另一种自然语言(目标语言)的文本形式输出,而且两种语 言的文本在意义上应该是等价的。 _一、 机器翻译的发展及现状分析 计算机问世后下久,机器翻译的研究工作电就开始了,经过几十年的发展, 凡.类占三这个领域内积累下很多理论成果,也开发f刁:少机译系统。传统饥器 翻译大多采用基于规则的方法,从总体模式上可以分为三类:直接翻译法 approach)。 直接翻译从源语言的表层句子出发,将单词或固定词组直接置换成目标语 言的对应成分。(这种方法对翻译过程的认识过于简单化,基本上属于一种过 时的方法。) 中间语言法把源语言经过分析转换成一种对所有语言都适合的一种句法一 语义表示,从这种表示可以生成任何一种目标语言。在设计多种语言互译的 机器翻译系统时,这种方法在理论上是非常经济的。 转换方法采用两种内部表达并按三个阶段进行翻译,第一个阶段把源语言 转换成源语言的内部表达,第二阶段把源语言的内部表达转换成目标语言的 内部表达,第三阶段再根据目标语言的内部表达生成目标语言。如今许多实 用的系统都采用了这样的总体结构(参考文献11)。 从本质上讲

文档评论(0)

1亿VIP精品文档

相关文档