维语对偶词识别的规则分析-Read.pptVIP

  • 6
  • 0
  • 约5.89千字
  • 约 24页
  • 2017-08-26 发布于天津
  • 举报
维语对偶词识别的规则分析-Read.ppt

基于规则的维吾尔语对偶词的识别 A Rule-Based Recognition of Uyghur Antithesis Words 扎依达·木沙 1,吐尔根·依布拉音1 (1.新疆大学, 信息科学与工程学院 830046;2.新疆大学, 信息科学与工程学院 830046) 维吾尔语自动分词是维吾尔语信息处理的基础工程,维吾尔语对偶词的自动识别则是维吾尔语自动分词的难点之一。维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词。本文首先介绍了对偶词的基本概念以及分析了维吾尔语对偶词的结构特征。然后在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法。 概况 引言 自然语言处理是人工智能的一个重要分支,也是一个及其活跃的研究领域。自动分词是自然语言处理的一项基础性工作。自然语言处理中首先要解决自动分词的细节问题。汉语自动分词系统是利用计算机对汉语文本进行词语自动识别的系统,对其的研究已经取得了一定的成果。但是到目前为止,研究一个实用的现代维吾尔语(以下简称维语)分词系统在处于初级研究阶段。 我们不能把维语的分词和切分词混为一谈,在维语文本中大量的词以“词=词根+附加成分”的形式出现,词根指的是词的基本语义单位,维语附加成份有前接附加成分和后接附加成分,词的切分指的是把词根和附加成分切分开。维语文本中词与词之间

文档评论(0)

1亿VIP精品文档

相关文档