手写体汉字自动分与识别.pdf

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
手写体汉字自动分与识别

圭塑窒望盔堂堡主堂垡堡塞—— 手写体汉字自动切分与识别 摘要 Character Reader)㈣像处理与模式识别领域中古老而 i光学字符识别OCR(Optical 艰苣的研究内容。特别是离线手写体汉字识别技术离实用还有一定的距离,原因之一是因为 目前字符识别系统主要是基于单字。对于手写体汉字切分的主要困难在于粘连或重叠的汉 字,笔划粘连在一起,难于用投影或连通元的方法分开。另外,左右结构的字,如果两边写 的较开,也容易被当成两个字或和其他宇错误的合并。因此字符切分是字符识别系统的重要 组成部分。字符切分对提高整个系统的字符识别率具有重要意义。对数字。英文等字符的切 分方法已有一些报道,对汉字切分,尤其是手写体汉字切分的研究较少。j 本文以“邮政信函自动分拣系统”为研究背景,以信函地址汉字为对象,研究了自由体 手写汉字切分和识别。该课题将通过手写信函地址汉字识别,以作为邮政编码识别的辅助手 段。论文实验采用由OVCS信函自动分拣机从实际分拣现场采集的真实民用信函上的二值 化图象。 本文主要研究内容包括:地址汉字区定位,书写线检测与去除,文字切分,文字识别。 /本文用最小方差原理下的多步切分和提取笔划的动态规划法,对手写体汉字进行切分, 能融}的处理粘连等汉字的切分,取得了较好的效果。主要工作和创新之处在于: (J)在标准Hough变换的基础上,提出一种改进的标准Hough变换算法,对书写线 进行定位,再用数学形态学的方法去除书写线,同时保留字符笔划上的点。改 进算法通过存储空问复用减少了Hough变换的内存空间要求,并提高运算的速 度;在去除信封地址书写线的应用中,结合实际,用限定搜索的角度范围,和 提取特征点的方法,提高了检测书写线的速度,使对书写线的检测和去除达到 了实用化水平。 (2)根据手写体汉字的特点,在方差最小原理基础下,提出多步切分算法(粗分一 细分一合并)和穿越算法。首先根据字段间问隔,用最小距离聚类的方法,得 到5组粗分结果;从中选出晟接近理想的一种,用改变类间距离和穿越算法, 对较宽的字段进行细分;最后将过细的分割部件合并成一个完整的字。对现场 采集的3000封信函进行切分,单字正确率达90.8%。 (3)提出一种基于方向游程的笔划提取方法,通过建立笔划框,根据汉字的笔划结 构知识对笔划框进行合并,形成候选框:将候选框作为节点,根据候选框的宽 度和相互间距离,求出节点间合并的代价,用动态规划法得到对应全局最优的 一组切分,作为最后的切分结果。用这种方法能较好的解决粘连宇的切分问题, 对现场随机采集的2435封信函地址汉字切分的单字正确率达到91.5%。 (4)探讨了信函自动分拣机上将地址汉字识别与邮政编码识别将相结合的实现方 法,如通过建立地址频率库,来提高信函分拣的正确率。 (5)探讨了在切分过程中适当利用一些识别信息,如上下文关系和语义信息,来进 一步的提高字符的切分和识别效果。j (/ 关键词:汉字切分,文字识别,直线检测,动态规划法,最小方差原 理 占塑奎望查堂堕主兰垡兰皇———————————————一 AUTOMATIC OF CHARACTER CHINESE HANDWRITTEN ABSTRACT thefieldo

文档评论(0)

chuotuo0075779 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档