基于语料库的机器翻译系统-公开课件(讲义).pptVIP

基于语料库的机器翻译系统-公开课件(讲义).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器翻译原理—— 基于语料库的机器翻译系统;语料库(Corpora)的定义;语料库的分类;1.基于统计的机器翻译; 首先,我们对双语语料库的每个句子的词语对齐,然后查找并记录所有句子中包含的互为翻译的双语短语(实际上是根据某些限制条件产生的双语词串),并在整个语料库上统计这些双语短语的翻译概率,当机器接受一个待翻译的语句,会先到源短语表中去搜索与之匹配的短语,接着,机器会以句子为单位,找出各种情况的短语组合,并参考多个因素计算每种短语组合的句子翻译概率,最后,机器会自动选出概率最大的短语组合作为原句的翻译译文,这里计算句子翻译概率的时候,除了考虑上面的短语翻译概率以外,还要加上句子的语言模型概率、句子长度特征等多种因素;我;统计机器翻译有以下优势: ①由于统计机器翻译是直接从语料库中获取翻译知识,不需要人工调试规则和词典,与传统的规则式方法相比,翻译系统开发的人工成本低、开发周期短; ②由于翻译知识是直接来源于大规模的真实的双语语料库,所以译文中会经常出现很地道的翻译表达形式; ③由于是带参数的机器学习,翻译与语言本身无关,所以翻译模型可以迅速迁移到新的语种和新的领域;2.基于实例的机器翻译;原 文 :PERSON was in CITY on DATE 译文:PERSON DATE在CITY 实例的泛化大大提高了实例的匹配率,可以减少实际翻译中所需要的实例库的规模理论上,实例可以逐步抽象成规则,基于规则的方法本质上可以看成是翻译实例高度抽象的结果。但是,由于自然语言的歧义性,泛化并不是一件轻而易举的事情。在很多情况下,待翻译的源语言还是很难找到可以覆盖的实例,这是基于实例方法的局限性,因而在很多情况下,基于实例的方法只是作为翻译系统中其他主流方法的一个补充。;thank you for your attention

文档评论(0)

小红帽 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档