脱机汉字识别的研究毕业论文.doc

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
脱机汉字识别的研究 目录 TOC \o 1-4 \h \z \u 摘要 h 1 1. 导言 h 2 2. 新的特征优劣量度标准 h 2 3. 噪声去除 h 4 4. 归一化预处理 h 6 4.1. 细化 h 6 4.2. 提取轮廓 h 8 4.3. 弹性网格 h 9 4.3.1. 矩形弹性网格 h 9 4.3.2. 扇形弹性网格 h 12 4.4. 改进的弹性网格 h 14 5. 汉字特征 h 14 5.1. 方向分解 h 14 5.1.1. 合取方向分解 h 15 5.1.2. 析取方向分解 h 16 5.1.3. 方向长度分解 h 17 5.1.4. 边缘检测分解 h 19 5.1.4.1. Prewitt边缘算子 h 20 5.1.4.2. Sobel边缘算子 h 21 5.1.4.3. Kirsch边缘算子 h 22 5.1.5. 边缘梯度方向角分解 h 23 5.1.5.1. Prewitt边缘梯度方向角分解 h 24 5.1.5.2. Sobel边缘梯度方向角分解 h 25 5.1.6. 汉字特征的实验比较分析及改进 h 26 5.2. Gabor方向分解 h 36 5.3. 黑像素分布特征 h 38 5.4. 不变矩特征 h 38 5.4.1. Hu不变矩 h 39 5.4.2. 仿射不变矩 h 39 5.4.3. 不变矩实验 h 41 6. 分类器设计 h 44 6.1. 模板分类器 h 45 6.2. 神经网络——BP网络分类器及改进 h 47 6.3. 神经网络——LVQ网络分类器 h 52 6.4. 隐马尔可夫过程分类器 h 53 7. 总结 h 55 参考文献 h 56 毕业论文(设计)任务书 58 毕业论文(设计)考核表 59 脱机汉字识别的研究 郑志洵 导师:杨建刚 浙江大学计算机科学与技术系 摘要:本文提出了一种独立于分类器的特征优劣量度标准——类间类内方差比,用其比较了用不同方法提取出的汉字特征的优劣,并改进了预处理和特征提取的方法,取得了更好的效果。对各种分类器用于汉字特征的分类识别做了实验比较,改进了BP神经网络分类器的结构,使其对类似汉字识别的超多类别分类有较好的效果。最后得到了一套可行的脱机汉字识别方案。 关键词:脱机汉字识别 特征提取 分类器 Abstract: This paper proposes a classifier-irrelevant feature measure, which is used to compare the diverse feature of Chinese character extracted by different methods. A meliorated method is proposed in pre-processing and feature extraction with improved efficiency. Various classifiers used in Chinese character recognition are compared by experiments. Improvements are also made to the BP neural network classifier for a better solution in the issue of categorization of excessive classes when dealing with Chinese character recognition. In the end, this paper comes to an applicable scheme of offline Chinese character recognition. Key words: Offline Chinese character recognition, Feature extraction, Classifier 导言 在社会信息化的今天,大量的信息使用了计算机来存储、处理和传输。将纸质媒介上的信息输入计算机,最简便的方法就是使用扫描仪。但是,扫描进计算机的是图像,图像占用的空间大,而且查找、修改等处理都非常不便,传输也要花费大量的时间,没有体现出计算机强大的信息处理能力,因此有必要将图像中的汉字识别出来,用内码存储,这样对信息的各种处理都会非常方便,而且能节省大量的资源,包括存储空间和传输时间。让计算机自动地从图像中识

您可能关注的文档

文档评论(0)

weidameili + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档