网站大量收购独家精品文档,联系QQ:2885784924

是国家863计划的成果。在863.PDFVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[J防科学技术大学研究生院学位论文 关电子元件功能愈来愈强,价格却迅速的下降,这一方面为OCR的发展莫定了坚实的基 础,另一方面也使制造 OCR的成本迅速降低,促进了产品的普及,大量的企业加入到了 OCR产品的研发和生产领域中。OCR系统在功能增加增强的同时,体积却变得更加轻巧, 使用更加便利,最终产品日趋成熟。使用OCR产品不再只是银行、邮政等大企业的专利, 大量的中小型企业乃至办公室和个人都成为了OCR技术的受益者。这个阶段,OCR识别 文字的能力得到了很大提高,对于输入文木的种种限制进一步放松了,手写文字的识别渐 渐成为了OCR 的主要研究方向。识别的算法理论不再只是采用原来模板匹配的方法,结 构分析、人工智能的成果不断被吸取、采用。广泛使用的OCR产品推动 了相关的文字处 理、排版、出版领域的发展,丰富了人类获得知识的途径,加快了信息生产发布的速度. 我国关于汉字OCR技术的研究就起始于这个时期。由于中文汉字的特点,对汉字的识 别问题一直是模式识别领域较难解决的问题。直到七十年代末我国才开始有关汉字OCR 的研究。正式的OCR产.AOCl是国家 “863”计划的成果。在 “863”计划中,中文汉字识别 问题与中文的语音识别问题 -同列入了智能计算机研究的主题。由于得到国家稳定的经济 资助,OCR技术随之从算法策略到硬件实现都得到了飞速的发展。 经过几十年的发展,现在OCR技术取得了很多进展。无论是国内和国外都有了很成熟 的OCR的产品。对于简中的文档,OCR可以达到很高的识别正确率。传统的OCR产品主 要解决文字 自动录入的问题,现代的OCR产品实际上己经成为了现实世界和计算机世界 的一座桥梁,在全社会信息化、r匕子化中贡要的一环。我国是历史悠久的文明古国,遗留 卜来丰富的文字文化财产,经过几代人的不懈努力,很多有价值的资料都出版了相应的书 粉专门保存。书籍与古代的瓷片、竹简保存相比固然有很大优势,但同样存在着占用空间 人、存储条件要求高的特改,井-[1不利于快速的检索和资源的共享。以OCR技术为核心 的图书数字化加1_系统,可以自动批量的将传统的图书馆,转化为数钾化的图书馆,结合 网络技术实现图书信息的高效检索和资源的共享,对于保存优秀文化财产、提高国民文化 索质,推动科学技术的普及发挥巨大的作用。越来越多的人意识到了计算机的重要作用, 可是低速、难以掌握的键盘录入又将很多人关到了计算机的大门之外,手写识别的OCR 系统,吏‘广大的电脑爱好者又贡新坐到了屏幕前面。 现代化的排版技术使得一书籍或文章突破了只有文字内容的限制,图片、表格和其他的 格式信息大量应用1几印刷品的设计之中,能否识别出这些排版信息,并在电脑中准确还原 出文档本米的信息,也成为了OCR正在突破的领域之一。将来,OCR技术肯定会变得更 加成熟,不仅对西方字体有较f;,的识别率,对于以汉语为主的东方字体也能达到很高的识 别率:不仪对印刷字体可以正确识别,对于多种多样的手写字体也能识别自如;单一字体 能识别,图文混排多种字型字体的文档同样可以识别。对于现在越来越多的多媒体信息, 结合语音识别技术,从连续的图像数据中提取字幕信息也逐渐开始了研究。伴随着OCR 技术的发展,OMR(光学符号识别)、ICR(智能字符识别)、条形码技术和基于内容的图像 检索技术都得到了相应的发展。作为计算机学习人类知识的眼睛,OCR技术有着广阔的应 Pi领域,同时也受到了来自诸如磁卡识别等各方面的挑战,如何面对这些挑战是摆在各国 OCR研发人员而前的一个课题。 .2.3光学字符识别的王要方法 -,--.~一,~~一一-,~- 第 4 灭 国防科学技术大学研究生院学位论文 Tausheck在提出OCR这个概念的同时,也相应地提出了一种基于模板匹配的识别方法。 在其后很长的一段时间!,‘,由于受到理论基础和电子工艺水平的限制,模板匹配一直是OCR 中主要采用的识别策略2〔1。计算机的出现和电子器件生产工艺的提高极大的推动了OCR 技术的进步,新的理论方法不断运用到OCR领域之中。 识别过程首先使识别设备学习、记忆将要辨识字符的特征,使这些特征成为识别系统 自身的知识,然后再利川这些先验知识对输入图像进行判决,得到字符的识别结果.字符 的特征不仅仅局限J飞平而上的点阵位置信息,在频率空间、投影空间、甚至语

文档评论(0)

ldj215323 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档