汉英机器翻译系统英文生成中的一种选词模型研究-计算机应用专业论文.docxVIP

汉英机器翻译系统英文生成中的一种选词模型研究-计算机应用专业论文.docx

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘要 摘要 摘要 本文提出了一种用于汉英机器翻译的英文生成选词模型,该模型结合基于语义模式和 基于实例与统计的选词方法,利用词汇语义搭配知识,有效处理了英文生成选词问题。 选词模型中,基于语义模式匹配的选词算法用来完成词汇初选工作,目的是减少候选 词集的规模以降低后继选词步骤的工作量。其基本思路是:对候选集所包含每个词,先从 事先构建好的模式库中查出其相应的语义模式,再将中间语言中待确定译文词的词汇概念 周边语义槽的具体值与语义模式对应的语义槽限制条件值进行比较,并根据它们的匹配情 况计算该词被选中的可能性,最终选择最有可能的词作为选词结果。本文除了用算法实现 了该思路,还介绍了用作模式匹配的语义模式库的构建过程,其间,文章提出了语义模式 自动训练的模式库构建方式和模糊语义模式的概念,从模式库构建的角度给出了语义模式 匹配选词法的故进策略。 ?基于实例比较和统计的选词算法用来实现对候选词的进~步筛选,是选词模型的主要 选词依据。该算法以待确定译文词的词汇概念之周边语义槽具体值与候选词相应实例对应 语义槽值的语义近似度计算为基础,根据由这些近似度确定的该候选词的相关统计指标进 行选词。算法中用以比较的实例从经语义标注的语料库里抽取而得,为解决语料库的语义 标注形式与实际实例中词义应有的语义表现形式不一致的问题月i文在介绍实例抽取的过 程时提出并详细介绍了从WordNet到知网的词义映射算法。 /全文共分为五章: 第一章是绪论,概述了机器翻译研究的重要意义以及基于中间语言的机器翻译系统中 生成模块研究的重要性;提出了本文的研究课题——生成选词问题,并简要比较了不同系 统对该问题的处理方式:最后列出了本文的工作要点。 第二章是系统结构和基础知识,提出了选词模型的总体思路,简要介绍其系统结构; 并对中间语言表示方法及基于知网的语义计算模型等有关基础知识进行了介绍。 第三章花了大量篇幅集中介绍了支持选词的数据资源之构建情况,包括实例库的构建 和语义模式库的构建。其中着重介绍了从WordNet到知网的词义映射算法、模糊语义模 式自动训练算法等内容。 第四章是选词模型的算法实现,包括对基于模糊语义模式匹配的选词算法以及基于实 例比较和统计的选词语算法的介绍。本章最后还提供了对反语义模式和反例及其在生成选 词问题中的可能应用的讨论。 第五章总结了本文的主要工作,讨论本文研究的主要特色,并提出进一步工作的设想。一 关键弓t自然语言处理、机器翻译、中间语肓}选词、模式匹配、睡于实例、基于统计、)f 知网、_近似度、8EMcoR、wo柑N甜、映射、)聚合度、模糊语义模式 垒!墨竺一————Abstract 垒!墨竺一———— Abstract This thesis presentS a descdption ofa lexical selection model applied in English generation of the Chinese·English machine translation system.This model realizes lexical selection using semantics knowledge of lexical collocations.It combines two lexical selection methods,that is, the method basing on semantics patterns and the method basing on examples.The former is used to perform primary lexical selection.And the later,on the other hand.is used to dO further Iexical selection.The semantics patterns used in this system are named fuzzy semantics patterns. They a”different from the traditional ones and will be trained from an example base with a training algorithm。The examples used for comparison will be extracted from a corpus called SEMCOR.SEMCOR is semantically tagged with WordNet senses.However,the semantics information ofthe examples is required to be

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档