基于多特征的搭配翻译模型研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯 第39卷 第 11期 哈 尔 滨 工 业 大 学 学 报 V01.39 No.11 2007年 11月 JOURNALOFHARBIN INSTITUTEOFTECHNOLOGY NOV.2007 基于多特征的搭配翻译模型研究 陈 鄞,吕雅娟,李 生 (1.哈尔滨工业大学 国家教育部微软重点实验室 ,哈尔滨 150001,Em·ail:chenyin@mdab.hit.edu.cn; 2.微软亚洲研究院,北京 100080) 摘 要:提出一种新的搭配(Collocation)翻译方法,该方法在最大熵模型框架下,充分利用各种从单语和双 语语料库中获取的信息.与过去的过分依赖双语语料库的方法不同,新的搭配翻译方法可以使用单语语料库 训练翻译模型,在搭配内在信息的基础上,进一步引入 了上下文信息.采用EM(ExpectationMaximization)算 法估计基于上下文的词汇翻译概率.本模型同时具备集成来 自双语语料库信息的能力.实验表明,本文方法 优于现有的基于单语语料库的搭配翻译方法,在双语语料库的支持下还可以得到更好的结果. 关键词:搭配;最大熵;单语语料库;EM算法 中图分类号:TP391.2 文献标识码 :A 文章编号:0367—6234(2007)11—1790—06 Studyonthefeature—richcollocationtranslation CHENYin,LUYa-juan,LISheng (1.MOE—MSKeyLaboratoryofNaturalLanguageProcessingnadSpeech,HarbinInstituteofTechnology,Harbin150001, China,E—mail:chenyin@mdab.hit.edu.ca;2.MicrosoftReserach,Asia,Beijing100080,China) Abstract:Thispaperproposesanew methodforcollocationtranslation.Weexploitacollocationtranslation modelthatcanmakefulluseofallavailableinformationderivedfrom bothmonolingualandbilingualcorpora. Insteadofheavilyrelyingonbilingualparallelcoprora,ourapproachcantraintranslationmodelsusingmono· linugalcoprora.Bothinside—collocationinfomr ationandcontextual infomr ationareexploitedinourmode1.The EM algorithm isappliedtoestimatecontextual wordtranslationprobabilitiesusingamonolinugalCOprUS.Our modelalsohastheabilitytointegratebilingualderivedfeaturesiftheyareavailable。Experimentsshow that ourapproachoutperfomr stheexistingmonolingual coprusbasedonmethodsin collocationrtanslationna da· chievesbetterresultswhenmakinguseofavailba lebilinugalcoprus. Keywords:collocation;maximum entropy;monolinugal coprora;expectationmaximizationalgorithm 高质量的搭配翻译对于机器翻译、跨语言信 行语料库中抽取搭配译文.除搭配翻译外,也有一 息检索、

文档评论(0)

无敌 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档