数字模糊法在汉字识别中的应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字模糊法在汉字识别中的应用 ,_—————一一 牛光方应谦曹守建 (郑州■放军电子技术学院450004) 摘要本文提出了一种新颖的汉字识别方法即数字模糊汉字识别法。其特点是算甚筒单、识别速度 快。而且占用计算机资源少,是值得进一步研究识别方挂。在文章中说明了该识别法的基本原理和匹配 规则.1}{及为提高识别率所采取的措蓝。 关-调投字孳别模鬯声槊毪字库匹哭 1引 言 随着信息化社会的到来.计算机已应用在社会的各个角落。在办公自动化方面。计算更 是不可或缺的主角。如何将大量的手写或印刷的书面文字资料经仪器(如扫描仪)直接输入计 算机以进行编辑、存储、传输,是办公自动化的重要课题,因为只有这样才是真正意义的办公 自动化。近十年来,我国不少科研院所投入了很大的人力、物力对汉字识别技术进行了深入的 研究探讨,井取得了不少成果。其中对印尉体汉字识别的研究已达实用阶段。而在现有的较 为成功的几种汉字识别技术中,无论其理论和实现算法都非常复杂。我们知道。繁杂的计算和数据 匹配将占用计算机相当的资源空间和运行时问,这也不利于技术的改进和升级.复杂的计算是进一 步提高识别速度的主要“瓶颈”。所以要提高汉字识别速度,必须从简化算法、提高资源利用率入 手。为简化识别算法,我们用数字模糊法进行了尝试,在不降低识别率的前提下,明显提高了识别 速度。 2对汉字的数字模糊化处理 待识字经扫描仪进入计算机,经过切分、规整化、细化等过程后,可以点阵形式存于算机内存或 X 磁盘上。如待识字是印刷体“大”字,经扫描进入计算机,并经一系列处理后。当以8 8点阵存贮 时,从直观上看就是如图1所示。 我们可以将该点阵制成一个测试(待识)模式。这里用lO代表实点“*”,可以设在平面上距 离实点“*”越远,数值递减t(在这里可设t;2),直到0为止。这样就形成该待识字特征向量空 间.如图2所示。 如果将具有相同值的点用细线相连接,连接线就如同地图测绘上的等高线,如图3,所以我们 也可以称该识别算法为等高线距离测度识别算法。 3—76 4 4 4 6 8 6 4 4 6 6 6 8 8 6 6 8 e 8 8 8 B 8 8 8 8 8 8 8 8 6 6 8 8 8 6 6 8 8 6 8 8 B 8 6 4 6 8 图1 田2 这样,对一个经上述处理的汉字点阵来讲.其每一个点都对应着具体的值.这些值就能较为细致地 反应出一个字的总特征。我们把这种给汉字点阵的每一个点按一定方式赋值的方法称数字模糊 法,经模糊后的点阵称为该字的模糊框架。下图为24×24点阵的“艾”和“爱”字经细化和规整化。 又经数字模糊化后的模糊框架,其中“·”代表点阵的实点。t=1。 圈3 圈4 3模糊框架的匹配 我们知道。模式识别问题简单说就是解决相似度8(xk,xi)的问题.其中xk,xi是样本集合x 中D维空间中的两个样本。在各种空间中。只要定义任何一种距离度量,就可以用这种距离度量 的非增函数效作为相似性度量。在D维欧几里得空间中,可以选择某个随距离增加而下降的函数 f作为相似性度量。即 6(砘x1)=f(压D、砘一酬2 也可用其他的距离度量。如

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档