手写字符识别系统设计.docx

下载文档 降价啦

21
0
约5.61千字
约 10页
2019-08-01 发布于浙江
举报
版权申诉
保障服务

手写字符识别系统设计.docx

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

版本：V1.0 手写字符识别系统设计说明书湖南大学信息科学与工程学院二0一四年六月目录 TOC \o 1-3 \h \z \u HYPERLINK 1 引言 2 HYPERLINK 1.1 目的 2 HYPERLINK 1.2 阅读对象 2 HYPERLINK 2 项目概述 2 HYPERLINK 2.1 项目简介 2 HYPERLINK 2.2 项目任务 2 HYPERLINK 2.3 实验环境介绍 2 HYPERLINK 3 任务描述 3 HYPERLINK 3.1 背景资料概述 3 HYPERLINK 3.2 系统组成 3 HYPERLINK 3.3 系统评估 5 HYPERLINK 4 机器学习算法介绍 5 HYPERLINK 4.1 支持向量机 5 HYPERLINK 4.2 BP神经网络 6 HYPERLINK 4.3 决策树方法 7 HYPERLINK 5 特征选择 8 HYPERLINK 6 参考资料和实用网站 9 引言目的随着图像处理技术与机器学习技术的发展，机器视觉技术已广泛应用于工业生产、日常生活及城市管理中。字符识别作为机器视觉的一种基本应用，在车牌识别、光学字符识别（OCR，Optical Character Recognition）等应用中均有涉及。本说明书旨在介绍基于常用机器学习算法（如BP神经网络、支持向量机、朴素贝叶斯、K近邻分类）的手写字符识别系统的设计需求，设计方法和环境介绍，帮助学生了解字符识别的基本流程，常用机器学习算法的基本原理，掌握机器视觉应用的开发技术。阅读对象本说明书的阅读对象有：数字媒体类相关专业学生相关客户人员，体验用户等项目概述项目简介本项目旨在基于机器学习算法实现手写字符（包括数字和大小写字母）的识别。该系统通过读入一张图片或通过鼠标绘制字符的方式，实现识别对象的输入，通过BP神经网络、支持向量机、朴素贝叶斯或K近邻分类方法实现手写字符的识别，并输出识别的结果。项目任务项目名称：手写字符识别系统的设计项目内容：1）手写字符的输入； 2）图片预处理与特征提取； 3）机器学习与字符分类；项目周期：1个月（2014年8月25日——2014年9月20日）参与人数： 2~4人。实验环境介绍 A）Visual Studio 2010 Visual Studio 2010是继VC6.0后微软推出的一款新的高级语言编译器，可支持C#、C++、Basic以及Asp等编程语言的开发，具有强大的代码调试功能，是一个功能强大的可视化软件集成开发工具。本项目将使用Visual Studio 2010进行代码的编辑、编译与调试。 B）Visual Assist 为了提高代码编写的效率，可安装Visual Assist X插件。Visual Assist X插件是WholeTomato公司针对Visual Studio开发环境开发的一款代码编写辅助工具，能够实现变量名、函数名的自动提示与补全，以及函数定义与声明之间的快速切换，从而达到提高开发效率的目的。 C）OpenCV OpenCV（Open Computer Vision）是一个开源的跨平台计算机视觉库，可以运行于Linux、Windows和Mac OS操作系统上。它轻量级而且高效，实现了图像处理和计算机视觉方面的很多通用算法。本项目可利用OpenCV实现图像的读取、显示以及一些基本的预处理算法。网址： / 任务描述背景资料概述机器学习：利用计算机模拟或实现人类的学习行为，以获取新的知识或技能。因此，机器学习算法通常包括两个阶段：训练和分类。训练阶段，即利用一些已知的训练样本训练得到机器学习算法模型的相应参数。该阶段类似于小孩认字时的学习阶段，老师告诉小孩各种字具有什么样的特征。分类阶段，即对于训练好的算法模型，给定输入数据，计算机自动给出数据的分类。该阶段类似于小孩在进行了学习后可以自主的识字。目前常用的机器学习算法包括：支持向量机（SVM，Support Vector Model）、BP神经网络、决策树系统组成基于机器学习的手写字符识别系统通常包括四个部分：图像预处理、特征提取、字符训练与字符识别四个阶段，如 REF _Ref395884962 \h 图 1所示。图 SEQ 图 \* ARABIC 1 字符识别系统的功能框架图像预处理：主要包括图像的去噪（中值滤波、高斯滤波），图像的二值化（将彩色图像或灰度图像转化为二值图像），形态学处理（利用闭操作，即先膨胀再腐蚀，将断裂的笔画进行修复）。特征提取：字符图像由一系列二进制的0和1组成，虽然这些数据包含了字符的全部信息，但是这些