多策略机器翻译系统IHSMTS中模式库的设计.pdfVIP

多策略机器翻译系统IHSMTS中模式库的设计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

moc.pivqc.www//:ptth维普资讯

MicrocomputerApplicationsVo1.18,No.3,2002研究与设计t型电脑矗J日2002年第18卷第3期

多策略机器翻译系统IHSMTS中模式库的设计。

晋蘸夏云庆王建德

摘要本文介绍了语料库研究的一些特点,并以交互用目的建立不同的语料库。在机器翻译领域,语料库的使用主

式多荒略的思想为背景对IHSMTS系统CBMT翻译引掌中要存在两种方法:纯统计法和例子模仿法.

模式库曲设计与宾现问趣进行了探诗,提出了面向对末的分I.基于统计的语料库技术

类模式库的设计思想,并对模式的表示、模式库的组织进行了它由WarrenWeaver于1949年首先提出,并成功地用在

阐述,方便了模式库检索,添加等操作的实现。同时介绍了近了语音识别系统中。后来,P.Brown等人继承和改进了

拟模式匹配算法,从句珐功能相似的角度抽取出所比较事例Weaver思想,并把它用于机器翻译疆域.其基率思想是一种

的功能词和句法特征、作为棰索模式库和柑似度计算的依据。语盲的一个句子是另一种语盲中任何句子的一种可能对应,

最后介绍了模式库知识获取和知识精练的过程。对于每对句子(s,T)(s表示原语言句予,T表示目标语言句

关蕾词人工智能机械翻译语料模式库子)都赋于一个概率Pr(Tfs),表示当原语言中s出现时,人

们译出T的可能性。机器翻译可看作是这样一个过程:给定

引言一个目标语言句子T,去搜京人们译出T的原句子S。

基于统计的方法不需要大量知识的依赖,直接依赖统计

二十世纪八十年代,机器翻译研究开始进人了全面发展结果进行歧义的处理和翻译的选择,避开了语言理解的诸多

的黄金时代.但是也面临着一些严峻的问题。倒如:机器翻译难题。但语料的选择和处理不但工程置巨大,而且需要同实际

系统的译准率长期徘徊在7O左右,译文的可读性,系统的处理问题相近,因此通用领域的机器翻译系统较少以统计方

鲁棒性尤其是开放性都不尽如人意。社会迫切需要对真实文法为主。

本进行大规模的语言信息处理而过去几十年由于种种条件2.基于例子的方法

限制,研制的自然语言理解系统和机器翻译系统同当今社会

基于倒子的机译方法是1984年由日本的Nagao博士首

对大规模真实文本处理的期望甚远。

先提出的、当时他称为“Memory--basedTranslation。其原理

机器翻译系统的译准率和译文可读性之所以不尽人意.

是;建立一个语言数据库.其中存放大量的例子及其对应的译

是因为在翻译过程中存在着下列问题1.原文句子分析时的

文(倒子可以是各种语言成分.包括词、片语和句子,甚至篇

语法结构和语义结构存在歧义.2.多义词译词选择问题。3,

文档评论(0)

wyg1235 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档