- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
脱机汉字识别的研究
目录
TOC \o 1-4 \h \z \u 摘要 h 1
1. 导言 h 2
2. 新的特征优劣量度标准 h 2
3. 噪声去除 h 4
4. 归一化预处理 h 6
4.1. 细化 h 6
4.2. 提取轮廓 h 8
4.3. 弹性网格 h 9
4.3.1. 矩形弹性网格 h 9
4.3.2. 扇形弹性网格 h 12
4.4. 改进的弹性网格 h 14
5. 汉字特征 h 14
5.1. 方向分解 h 14
5.1.1. 合取方向分解 h 15
5.1.2. 析取方向分解 h 16
5.1.3. 方向长度分解 h 17
5.1.4. 边缘检测分解 h 19
5.1.4.1. Prewitt边缘算子 h 20
5.1.4.2. Sobel边缘算子 h 21
5.1.4.3. Kirsch边缘算子 h 22
5.1.5. 边缘梯度方向角分解 h 23
5.1.5.1. Prewitt边缘梯度方向角分解 h 24
5.1.5.2. Sobel边缘梯度方向角分解 h 25
5.1.6. 汉字特征的实验比较分析及改进 h 26
5.2. Gabor方向分解 h 36
5.3. 黑像素分布特征 h 38
5.4. 不变矩特征 h 38
5.4.1. Hu不变矩 h 39
5.4.2. 仿射不变矩 h 39
5.4.3. 不变矩实验 h 41
6. 分类器设计 h 44
6.1. 模板分类器 h 45
6.2. 神经网络——BP网络分类器及改进 h 47
6.3. 神经网络——LVQ网络分类器 h 52
6.4. 隐马尔可夫过程分类器 h 53
7. 总结 h 55
参考文献 h 56
毕业论文(设计)任务书 58
毕业论文(设计)考核表 59
脱机汉字识别的研究
郑志洵
导师:杨建刚
浙江大学计算机科学与技术系
摘要:本文提出了一种独立于分类器的特征优劣量度标准——类间类内方差比,用其比较了用不同方法提取出的汉字特征的优劣,并改进了预处理和特征提取的方法,取得了更好的效果。对各种分类器用于汉字特征的分类识别做了实验比较,改进了BP神经网络分类器的结构,使其对类似汉字识别的超多类别分类有较好的效果。最后得到了一套可行的脱机汉字识别方案。
关键词:脱机汉字识别 特征提取 分类器
Abstract: This paper proposes a classifier-irrelevant feature measure, which is used to compare the diverse feature of Chinese character extracted by different methods. A meliorated method is proposed in pre-processing and feature extraction with improved efficiency. Various classifiers used in Chinese character recognition are compared by experiments. Improvements are also made to the BP neural network classifier for a better solution in the issue of categorization of excessive classes when dealing with Chinese character recognition. In the end, this paper comes to an applicable scheme of offline Chinese character recognition.
Key words: Offline Chinese character recognition, Feature extraction, Classifier
导言
在社会信息化的今天,大量的信息使用了计算机来存储、处理和传输。将纸质媒介上的信息输入计算机,最简便的方法就是使用扫描仪。但是,扫描进计算机的是图像,图像占用的空间大,而且查找、修改等处理都非常不便,传输也要花费大量的时间,没有体现出计算机强大的信息处理能力,因此有必要将图像中的汉字识别出来,用内码存储,这样对信息的各种处理都会非常方便,而且能节省大量的资源,包括存储空间和传输时间。让计算机自动地从图像中识
您可能关注的文档
- 水塔水位自动控制系统_毕业设计.doc
- 水温控制器设计毕业设计论文.doc
- 水温控制系统毕业设计(论文).doc
- 水杨醛水杨酰腙的合成及其抑菌性能毕业论文.doc
- 水域全自动增氧喂料系统毕业论文.doc
- 水源地水质评价模型研究毕业论文.doc
- 水源物探法在泰安地区的应用毕业设计.doc
- 水闸工程毕业设计论文.doc
- 水族箱温度控制系统硬件设计毕业论文.doc
- 税率变动与上市公司资本结构的相关性研究毕业论文.doc
- 2024年山西省临汾市企业人力资源管理师之一级人力资源管理师考试真题题库附答案【基础题】.docx
- 2024年山东省泰安市企业人力资源管理师之四级人力资源管理师考试完整题库加答案.docx
- 2024年山东省济宁市企业人力资源管理师之四级人力资源管理师考试A4版可打印.docx
- 2024年山西省长治市企业人力资源管理师之一级人力资源管理师考试优选题库含答案(实用).docx
- 2024年山东省莱芜市企业人力资源管理师之一级人力资源管理师考试题库附答案【基础题】.docx
- 2024年广东省云浮市企业人力资源管理师之一级人力资源管理师考试完整题库【能力提升】.docx
- 2024年山东省菏泽地区企业人力资源管理师之一级人力资源管理师考试题库带答案(最新).docx
- 2024年山西省太原市企业人力资源管理师之一级人力资源管理师考试优选题库(名校卷).docx
- 2024年山东省聊城市企业人力资源管理师之一级人力资源管理师考试【基础题】.docx
- 2024年山东省淄博市企业人力资源管理师之四级人力资源管理师考试通关秘籍题库带答案(模拟题).docx
文档评论(0)