网站大量收购独家精品文档,联系QQ:2885784924

基于层次短语的汉蒙统计机器翻译研究.pdfVIP

基于层次短语的汉蒙统计机器翻译研究.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次短语的汉蒙统计机器翻译研究.pdf

第 42 卷第 3 期 2013 年 5 月 内蒙古师范大学学报{自然科学汉文版〉 Journal of lnner Mongolia Normal University (Natural Science Edition) 基于层次短语的汉蒙统计机器翻译研究 王春荣 , 王斯日古楞,阿 荣 (内蒙古师范大学计算机与传怠工程学院,内蒙古呼和浩特 0 10022) Vo l. 42 NO. 3 May 2013 摘 要:使用形式化的句法分析方法一→基于层次短语的翻译模型进行汉蒙统计机器翻译研究.实验证明. 基于层次短语的 6 元模型实验结果比基于短语的 3 、4 、5 和 6 元的结果都要好.进一步对基于层次短语的汉蒙统 计机吉普翻译系统译文中的汉语来登录数词迸行后处理,从而提高了翻译系统性能. 关键词 z 形式化句法;基于层次短语的翻译模型 s 汉蒙统计机器翻译;数词后处理 中图分类号: TP 312 文献标志码:A 文章编号: 1001- 8735(2013)03- 0350- 04 随着计算机技术的发展,基于统计的机器翻译方法已逐渐成为国际上机器翻译研究的主流方法之一.统 计机器翻译模型[ 1 .2] 大体分为基于词的翻译模型、基于短语的翻译模型和基于句法的翻译模型,其中,目前比 较主流的方法是基于短语的翻译模型. 基于短语的翻译模型能够解决局部调序的问题,也可以将一些习惯用语翻译得很准确,但是,长距离调 序能力很弱[3) 另外, P. Koehn 等人的研究结果发现,当短语长度扩展到 3 个以上时,该模型的性能提高很 少,因为对于较长的短语存在着非常严重的数据稀疏问题.例如: 我听说冷锋会袭击战们的城惋 HlJ1TEN-lj U]lfGUK 融w-V HOTA-Y1 监WVK~_A GE]lf 91 DVGVLJL_A 俑W;J、,楠、I~ ~吠制~) c晴胁、φ内 用基于短语的方法对汉语句子进行翻译,译文如下: 〔我] [听说] [冷饰] [会] [袋巾战们的城锁] ↓↓↓7二 飞91]飞D陀VL Vl雪,_AJ 飞HUJTE\-U U]lfGUR] 飞JUi\~V H,前扣rJ!I?捎回盯 正 [如 ] [ 句雨Ill) ] [ ~~1uo时就 ] [ W ~~ ω顿时) ] 从以上例子可以看出.基于短语的方法可以完成短语内的调序 [MAN-V HOTA-YI HAMVRVN _A (Wt CWI~ n.r..{, 汀,但却不能进行短语之间的调序.为此,蒋伟(4) 提出基于层次短语的翻译模型,试图解决这 一问题.层次短语模型的主要思想就是短语本身包含了更小的短语,从而利用层次短语本身的规则来解决短 语之间的长距离调序问题.这里基于短语方法中的短语是指任意连续的字符率,而不是语法意义上的短语. 层次短语是,由单词和子短语(任意连续的字符事)组成,如: Xl 听说 X2 , Xl X2 DVGVLVL_A( 句甜) ) , Xl 和 X2 是子短语,剩下部分是单词.该条层次短语的意思是,将汉语句子中Xl 昕说 X2形式的短语 翻译成蒙古语的Xl X2 DVGVLVL_A(句甜仆形式短语. 1 基于层次短语的翻译模型 基于层次短语的翻译模型融合了基于短语和基于句法的统计翻译模型的优点,它通过使用同步上下文 无关文法(SCFG) (叫 ,从没有任何语言学标注信息和假设成分的双语平行语料中自动学习获得所有翻译 收穰日朔: 2012-09-28 基金项目:国家自然科学基金资助项目 ) ;内豪古 自然科学基金面上项 目 (20 1 2MS09 1 8 h 研究生科研创新基金项目 (CXJJS11070) 作者简介 g 王春策 ( 1989一).女(蒙古~).内配合通辽市人.内.7可师范大学硕士研究生 .主要从事自然i弱言俄息处理研究. 第 3 期 王春荣等:基于层次短语的汉蒙统计机器翻译研究 ? 351 规则. 基于层次短语的翻译模型使用的翻译模板形式 :X→叶, α ,~).其中 X 为非终结符号 , y 和 α 都是非终 结符号和终结符号组成的字符串.~表示出现在 Y 中的非终结符与出现在 α 中的非终结符之间的一对一对 应关系.重写过程从一对关联的符号开始,在每一步操作中,利用一条规则的两个成分同时改写两个关联的 非终结符号.汉蒙翻译模板的例子如下: [残] [昕说] [[冷锋] [[会]袭击[[孜们L 的[城镇]]]] [HlIY1TEN-l! l!]lfG.四~ [[[脑W-V] [HOTA-Y1]] HAJlVRVN__A] GE]lf [B1] [DVGVLVL_A] [~~句阔前\ ] [[ 1J~] [侃.付]] 仿峙~)] o,e [蜘] [句耐) ] 此例子用到的

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档