光学字符识别探究.pptVIP

  • 4
  • 0
  • 约1.05千字
  • 约 10页
  • 2016-08-02 发布于湖北
  • 举报
光学字符识别(OCR) B.Y OCR是英文Optical?Character?Recognition的缩写.翻译成中文就是通过光学技术对文字进行识别的意思.? 它是自动识别技术研究和应用领域中的一个重要方面.它是一种能够将文字自动识别录入到电脑中的软件技术.是与扫描仪配套的主要软件.属于非键盘输入范畴.需要图像输入设备主要是扫描仪相配合.现在OCR主要是指文字识别软件 概述 其原理是通过专门的OCR软件,将含有文字的图像按字切割成可独立识别的单元,然后运用各种算法分析每个图像单元中文字的形态特征,通过比对标准特征库中的数据,判断出该文字在计算机中的标准编码,并按通用格式输出保存在文本文件中。 OCR的工作流程为:1.影像输入 2.影像前处理 3.文字特征抽取 4.比对识别 5.人工校正 虽然一张图像真正用于软件识别的时间不到一秒,但前期和后期的加工处理不可小视,尤其是前两个环节的操作,往往决定了OCR软件的识别率,乃至整个OCR工作的效率。而后期人工校正环节,则是保证OCR工作质量的最直接环节。 总的来看: 第一步是特征提取,第二部是分类识别。 第一步包括:二值化,页面矫正,文字块提取,文字分割,特征提取,etc. 第二步包括:训练时的特征与字符的映射关系存储,识别时的特征识别 第一部是通用的,第二步可以用各种机器学习的算法,包括ANN,SVM等算法 应用

文档评论(0)

1亿VIP精品文档

相关文档