汉维时间数字和量词的识别与翻译研究.PDFVIP

  • 42
  • 0
  • 约3.58万字
  • 约 12页
  • 2017-07-24 发布于江苏
  • 举报

汉维时间数字和量词的识别与翻译研究.PDF

汉维时间数字和量词的识别与翻译研究

汉维时间数字和量词的识别与翻译研究 · 1,2 · 1,2 阿依古丽 哈力克 ,艾山 吾买尔 , 1,2 1,2 1,2 · 吐尔根 伊布拉音 ,卡哈尔江 ·阿比的热西提 ,买合木提·买买提 (1.新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046; 2.新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046) 摘 要:统计机器翻译对时间、数字、量词的泛化能力较弱,为了提高汉维机器翻译系统对时间、数字和 量词短语的翻译性能,本文利用双语语料库挖掘并提取汉语时间、数字、量词表达与翻译模式,实现了 基于模板的时间、数字、无歧义量词翻译方法及基于上下文的有歧义量词翻译方法。时间、数字、无歧 义量词、有歧义量词的翻译 F 值达到了 93.23%、90.15%、96.55%、87.58% ,实验证明,本文提出的方 法具有简单高效的优点。 关键词:时间数字;无歧义量词;有歧义量词;翻译规则;翻译模板 中图分类号:TP391 文献标识码:A Research on Recognition and translation of Chinese -Uyghur Time and Numeral and Quantifier Ayiguli HALIKE1,2,Hasan WUMAIER1,2,Kahaerjiang ABIDEREXITI1,2,Maihemuti MAIMAITI1,2,Tuergen YIBULAYIN 1,2 (1.School of Information Science and Engineering,Xinjiang University ,Urumqi ,Xinjiang 830046 ,China ; 2 .Xinjiang Laboratory of Multi-Language Information T echnology ,Urumqi ,Xinjiang,830046 ,China ) Abstract :The Chinese-Uy ghur statistical machine translation system for times, numerals and quantifiers generalization ability are relatively weak. In order to improve the r ecognition and translation of Chinese- Uyghur machine translation system for times, num erals and quantifiers. This paper uses a method based on corpus to mine and extract of Chinese times, num erals and unambiguous quantifiers, based on context ambiguous quantifiers translation rules .Experimental result s show that the translation of time s , numerals ,unambiguous quantifiers and ambiguous quantifiers

文档评论(0)

1亿VIP精品文档

相关文档