matlink英汉机器翻译试验系统中词典的存储结构 - 信息工程大学学报.pdfVIP

matlink英汉机器翻译试验系统中词典的存储结构 - 信息工程大学学报.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
matlink英汉机器翻译试验系统中词典的存储结构 - 信息工程大学学报

第2卷 第4期 信息工程大学学报 V01.2No.4 2001年12月 ofInf0珊ation Dec.2001 Joumal En西neeringUniversity Matlink英汉机器翻译试验系统中 词典的存储结构及搜索算法 吴保民1,杜祝平2,张连海1,王炳锡1 摘要:本文详细论述了我们开发的基于规则的Matlink英汉机器翻译试验系统中词典的内部存 储结构和搜索算法,以一部综合英语词汇静态信息和动态信息于一体的英汉转换词典代替传 统的基于多部词典的机器翻译方法。试验表明该词典的数据结构和搜索算法较传统的基于多 词典的英汉机器翻译系统在词法分析和目标语生成方面具有较高的效率。 关键词:机器翻译;机器词典;哈希表 中图分类号:唧91 文献标识码:A 检索与处理,是理想完善的机器翻译系统的标志之 1 引言 ——o 译文的准确性和可读性是制约机器翻译 机器翻译试验系统时,如何充分体现语言学知识在 (Machinetranslation)系统走向商品化的根本问题, 提高译文准确率中所起的决定性作用,是我们考虑 而译文的准确性和可读性从本质上讲依赖于对源 的首要问题。经过认真的思考和分析,我们决定把 语言的准确分析和目标语言的准确自然表达。正 机器翻译过程中所需要的词汇、句法、语义、语用等 如专家所指出的,机器翻译归根到底是一个语言学 信息融于机译词典中,为系统提供充足的语言学知 问题,这一点应成为人们的共识…。 识。在词典的组织上,为了提高系统的速度,我们 机译词典(MTlexjcon)是机器翻译系统的基础 以一部英汉转换词典代替传统的多部词典的做法, 资源,是词法分析、句法分析和目标语言生成的依 并以语义为中心安排词条。同时,我们开发了一套 据,机译词典与传统词典在所含内容、信息的组织 面向机器的、准确简明的、信息的形式化描述语言。 方式、表示方式等方面都有着很大的差异。因为在 初步的试验结果表明,这部综合词典在解决英语词 整个机器翻译过程中系统所依据的主要是机器词 汇歧义、结构歧义、提高译文准确率等方面较传统 典,所以词典为系统提供的信息充足与否是影响机 的基于多部词典的机器翻译系统更为有效。本文 器翻译达到全自动和高质量(FAHQ)目标的首要因的第二部分论述了词典信息的内部存储结构,第三 素。其次,在保证词典信息充足的前提下,如何有 部分讨论了词典的搜索算法。 效地组织信息是提高MT系统效率的关键。例如, 传统的基于规则的英汉机器翻译系统大多采用综 2词典的存储结构 合词典、成语词典、多义词典、分离结构词典、汉语 词典等多部机译词典的组织方式。此外,如何以高 词典以词项为中心组织,把与该词条相关的短 度的形式化(Fo册alization)、信息的确定性 语、习语组织在同一词条下,并为词典编制索引。 (Accuracy)、规则的一致性(Agreement)来表示信息,每个词项长度不等,所包含的信息也有区别。一般 以最大限度地节省系统资源,同时利于计算机快速 结构如下: 收稿日期:200l一07一lO 作者简介:吴保民(1965一),男,河南商丘人,信息工程大学硕士研究生,副教授,研究方向为计算语言学,

您可能关注的文档

文档评论(0)

wujianz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档