- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于实例的机器翻译-方法和问题.pdf
维普资讯
· 语言信息处理 · 术‘语标准化与信患技术 003年第2期
基于实倒昀觚器翻译——方法和问题
◇王厚峰(北京大学)
关键词:基于实例的机器翻译,双语对齐,相似度计算,模板获取
摘 要:介绍了基于实例的机器翻译方法,并对基于实例的机器翻译 中的若干问题,如双语实
例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。
M ethodandIssues0fExample—BasedM achineTranslation
ⅣGHoufeng
Keywords:EBMT,BilingualAlignment,SimilarityMeasure,TemplateAcquisition.
Abstract:ThebasicframeofExamplebasedmachinetranslationisconcernedinthispaper.Some
keyissues,suchas bilinugal alignment,similaritymeasurebetween inputsentencenadexma ple,nad
templateacuq isition,areintroduced.
一 、 引 言 二、EBMT的基本思想
早期的机器翻译本质上都是基于语言规则或 长尾真认为,人们在翻译简单句子时并没有
语言知识 RBMT(RuleBasedMachineTranslation) 做语言的深层分析,而是先将句子分解为几个片
的。如,词法规则,句法分析规则,转换规则,目标 断 (短语),然后,借助于已有片断的翻译,将分解
语生成规则等。这些规则都是根据语言专家的经 的每个片断翻译成 目标短语,最后再将这些短语
验总结归纳出来的。直译法、转换生成方法、中间 组合起来形成一个长的句子。
语言方法等都可以归为这一类。在 1980年代中后 基于上述思想,长尾真提出了基于实例的机
期,这种纯粹基于语言知识的状况渐渐被基于语 器翻译EBMT的思想。对应地,EBMT也分为三大
料库的机器翻译 CBMT(Corpus—BasedMachine 部分:将实例划分为片断,确定各个片断的翻译以
Translation)方法打破 。 及重组片断。例 1:
语料库方法 中最有影响的是 IBM公司 的 (a)她买了一本计算语言学人门书
P.Brown提 出的基 于统计 的机器 翻译 SBMT 假定计算机内已经存储了如下的实例对:
(StatisticsBasedMachineTranslation)o受语音处理 (b)她买了一件时髦的夹克衫 .
的启发,P.Brown 在 1988年第二届TMI会议上提 Sheboughtasharpjacket.
— —
出了用 隐马尔科夫模
文档评论(0)