使用源语言复述知识改善统计机器翻译性能.PDFVIP

使用源语言复述知识改善统计机器翻译性能.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用源语言复述知识改善统计机器翻译性能

网络出版地址:/kcms/doi/10.13209/j.0479-8023.2015.032.html 北京大学学报(自然科学版) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2015.032 使用源语言复述知识改善统计机器翻译性能 † 苏晨 张玉洁 郭振 徐金安 北京交通大学计算机学院 , 北京 100044; † 通信作者 , E-mail: yjzhang@ 摘要 为了缓解双语语料不足所带来的翻译知识欠缺问题, 提出基于复述技术的翻译框架。此框架利用第 3 种语言获取带有概率的复述知识表 , 以 Lattice 表示输入句子的多种复述形式 , 扩展解码器使之可以对 Lattice 形式的输入进行解码, 将复述知识作为特征加入到对数线性模型的目标函数。在保持原始翻译知识表 不变的情况下, 此框架不仅可以增大短语翻译表对源语言现象的覆盖率 , 也能够增加候选译文的表现形式的 多样性。在 3 个不同规模训练集上的对比实验结果表明 , 在训练语料规模最小的情况下(10 K① ), 系统性能有 明 显 提 升 (BLEU+1.4%); 在 训 练 语 料 规 模 最 大 的 情 况 下 (1 M), 系 统 性 能 也 取 得 了 性 能 上 的 提 升 (BLEU+0.32%) 。 关键词 复述知识; 短语翻译表 ; 特征; 解码器 中图分类号 TP391 Improved Statistical Machine Translation with Source Language Paraphrase † SU Chen, ZHANG Yujie , GUO Zhen, XU Jin’an School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044; †Corresponding author, E-mail: yjzhang@ Abstract The performance of statistical machine translation (SMT) suffers from the insufficiency of parallel corpus. To solve the problem, the authors propose a paraphrase based SMT

文档评论(0)

l215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档