基于规则的现代藏文音节字检错研究.pdfVIP

  • 16
  • 0
  • 约9.47千字
  • 约 8页
  • 2017-09-03 发布于北京
  • 举报

基于规则的现代藏文音节字检错研究.pdf

基于规则的现代藏文音节字检错研究 才让叁智 关白 (西藏大学信息科学技术学院西藏拉萨850000) 摘要藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为 规则音节字(遵循组件组合规则的藏文音节字)和不规贝Ij音节字(不遵循组件组合规则的音节字)两种。 对规则音节字采用了音节字组件组合规则进行检错,对非规则音节字采用建立梵源藏文词典、音译藏文 词典和本体非规则音节字词典进行检错。实验表明,文章提出的藏文音节字检错方法对报纸类藏文的检 错率为100%。 关键词藏文音节字;音节字组件;组合规则;检错 1 DOI:10.16249/j.cnki.54—1034/c.2017.01.01 中图分类号TP391.1 文献标识码A 引言 随着藏文信息技术的飞速发展,藏文电子资源呈指数级增长。藏文电子资源在藏语语料库建设、机 器翻译、信息检索、问答系统、语音识别等领域有着重要的作用,是不可或缺的重要资料。目前藏文电子 资源数量可观,但其质量参差不齐,很难作为重要资料直接使用。因此,研究藏文自动校对是藏文信

文档评论(0)

1亿VIP精品文档

相关文档