6应用-汉字识别.pptVIP

  • 2
  • 0
  • 约 80页
  • 2017-09-20 发布于江西
  • 举报
6应用-汉字识别.ppt

第六章 模式识别的应用 汉字识别 文字识别问题 汉字识别系统 汉字的结构特性分析 印刷体汉字的特征描述 汉字识别方法分类 1、文字识别问题 1)汉字识别 2)汉字OCR技术发展历史 3)国内主要研究机构 1)汉字识别 汉字识别属于文字识别(OCR)的范畴,文字识别是模式识别的重要应用领域。汉字识别技术涉及到模式识别、图像处理、人工智能、模糊数学、组合论、信息论、计算机等多个学科,也涉及到语言文字学、心理学等学科,是一门综合性的技术。 汉字识别难度 印刷体识别 最容易 已经有了大量实际应用,图书馆数字化 2)汉字OCR技术发展历史 西文OCR技术研究始于50年代 Optical Character Recognition (OCR) 几乎所有的早期模式识别研究者都进行过字符识别的研究。随后的 30 多年来,字符识别一直是模式识别的重要内容之一 2)汉字OCR技术发展历史 70年代以来,日本人做了许多工作 日本的常用汉字有2000个左右 1977年东芝综合研究所研制了可以识别2000个汉字的单体印刷汉字识别系统 80年代初期,日本武藏野电气研究所研制的可以识别2300个多体汉字的印刷体汉字识别系统,代表了当时汉字识别的最高水平 日本的三洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统 简评 这些系统在方法上,大都采用基于KL数字变换的匹配方案,使用了大量专用硬

文档评论(0)

1亿VIP精品文档

相关文档