模糊网格中多种贡献度的单字识别技术.pdfVIP

模糊网格中多种贡献度的单字识别技术.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模糊网格中多种 贡献度设定的单字识别技术 曹守见 方应谦 牛光 (郑州电子技术学院203教研室450004) 摘要:模糊网格是汉字识别中比较常用的方法,由于汉字结构轮廓不同,因此 网格中各个部位对识别结果的贡献也不同,另外,相似字的不相似部位对识别 效果也有重要影响;因此奉文提出了设置多种贡献度的方法,提高了识别效果, 识别率高,对汉字识别系统的准确率具有较大的改进作用. 关键词:模糊网格贡献度设置 l前言 长期以来,汉字识别都是以汉语中的字作为识别的基本单位,称作单字识别。模糊 网格技术是印刷体汉字或手写体汉字识别系统普遍采用的策略。由于汉字的结构轮廓特 征千变万化,每个网格中的信息对匹配效果的贡献不同,再加上相似字比较多.而相似 字的不相似部位对识别效果具有较大影响,因此必须对模糊网格和不相似部位,设置不 同的贡献度,应用于识别系统。 2结构网格的划分 N 手写体汉字样张经过扫描仪扫描进 入计算机,转换成一幅图象,经过平滑、 去噪、版面切割、单字切割,分离出一 个个单字方块图形,把该单字方块图形 分成M*N网格。如右图I示。 M 厂●l●J一、●●L 图I汉字的网格划分 此时汉字可描述为 r啊,, 啊.2, ….%.N %2,…,%N (H。一:i):J‰, 。一,’。。 L%I …,‰.~ 、●●●}j 一154一 其中,彬,为局部图像网格,I≤i≤M,1≤j≤N。 对每个模糊网格图像按照专门的特征提取算法,提取出横、竖、撇、捺等四种基本 笔划元的模糊统计特征。因而汉字的特征可表示如下:(以横特征为例) 厂^”hi.2,…,hi,~-7 (H_tezheng)-lh2,1,h2”…,h2,t。I … l…,…,…t I L‰J,hM,2,…,‰。ⅣJ 令Q2M+Nt如用一维表示可记为(H—tezlleng)={hl,h2.…,^D} 同理,竖、撇、捺可表示为: (S_tezheng)2{51,02,…,电J (P—tezheng)2{Pl,P2,…,肋} (N_tezheng)。{一,n2,…,饧} N 3模糊网格的贡献度设定 对汉字的结构轮廓进行分析可知,汉字 的四角和边缘的信息量最大,因此对于模糊 网格中各个网格对匹配效果的贡献来讲,四 M 角和边缘的信息占的权值应较大。对每个网 格取不同的权值,作为对匹配识别效果的贡 献度.分析其影响.我认为如下取值较为合 厂●●j、l●L 理,匹配识别效果最佳,如右图2示. 图2网格贡献度设定 (1)对于网格的四角,取贡献度为K1: (2)对四个方向的边缘,取贡献度为1(2; (3)对其它网络取贡献度为K3。 (4)K1。K2,K3之间的关系为: K1=3+K3142=2*K3 按照此贡献度的设定,取得的匹配结果,识别率最好。 距离的计算公式为: 卫 Juli: ∑^t’(陋一^一zcrab一^I

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档