利用语言知识的汉字识别分类策略.pdfVIP

  • 3
  • 0
  • 约5.22千字
  • 约 4页
  • 2017-08-10 发布于安徽
  • 举报
6—57 利用语言知识的汉字识别分类策略 方应谦曹守建 牛 光 (郑州电子技术学院二系450004) 摘要本文分析丁单字分类的缺点.给出了以多字词及短语为分类的基本单位,利用Markov模型、语 言的多种统计知识及距离测度,进行分类的策略与方法。较好地克服了过去以单字为分类的基本单位 造成的识别率较低、识别速度较慢的缺点。 关薯调汉字识别语言知识分类 1 引 言 长期以来,汉字识别中的分类都是以汉语中的字作为基本单位,称作字分类。字分类的目的是 产生每个待识字的候选字集合.然后将此候选字集合送识别级进行细识别。这种识别系统称为单 字识别,单字识别是印刷体汉字或手写体汉字识别系统中普遍采用的策略。由于单字识别的能力 有限…12】,为了补救识别中产生的错误,通常都在后处理中利用了一些语言知识进行纠错。从本 质上讲,这种利用语言知识的纠错【3卜bJ。仍是建立在单字识别基础上的,受单字识

文档评论(0)

1亿VIP精品文档

相关文档