- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
版本:V1.0
手写字符识别系统设计说明书
湖南大学信息科学与工程学院
二0一四年六月
目录
TOC \o 1-3 \h \z \u HYPERLINK 1 引言 2
HYPERLINK 1.1 目的 2
HYPERLINK 1.2 阅读对象 2
HYPERLINK 2 项目概述 2
HYPERLINK 2.1 项目简介 2
HYPERLINK 2.2 项目任务 2
HYPERLINK 2.3 实验环境介绍 2
HYPERLINK 3 任务描述 3
HYPERLINK 3.1 背景资料概述 3
HYPERLINK 3.2 系统组成 3
HYPERLINK 3.3 系统评估 5
HYPERLINK 4 机器学习算法介绍 5
HYPERLINK 4.1 支持向量机 5
HYPERLINK 4.2 BP神经网络 6
HYPERLINK 4.3 决策树方法 7
HYPERLINK 5 特征选择 8
HYPERLINK 6 参考资料和实用网站 9
引言
目的
随着图像处理技术与机器学习技术的发展,机器视觉技术已广泛应用于工业生产、日常生活及城市管理中。字符识别作为机器视觉的一种基本应用,在车牌识别、光学字符识别(OCR,Optical Character Recognition)等应用中均有涉及。
本说明书旨在介绍基于常用机器学习算法(如BP神经网络、支持向量机、朴素贝叶斯、K近邻分类)的手写字符识别系统的设计需求,设计方法和环境介绍,帮助学生了解字符识别的基本流程,常用机器学习算法的基本原理,掌握机器视觉应用的开发技术。
阅读对象
本说明书的阅读对象有:
数字媒体类相关专业学生
相关客户人员,体验用户等
项目概述
项目简介
本项目旨在基于机器学习算法实现手写字符(包括数字和大小写字母)的识别。该系统通过读入一张图片或通过鼠标绘制字符的方式,实现识别对象的输入,通过BP神经网络、支持向量机、朴素贝叶斯或K近邻分类方法实现手写字符的识别,并输出识别的结果。
项目任务
项目名称:手写字符识别系统的设计
项目内容:1)手写字符的输入;
2)图片预处理与特征提取;
3)机器学习与字符分类;
项目周期:1个月(2014年8月25日——2014年9月20日)
参与人数: 2~4人。
实验环境介绍
A)Visual Studio 2010
Visual Studio 2010是继VC6.0后微软推出的一款新的高级语言编译器,可支持C#、C++、Basic以及Asp等编程语言的开发,具有强大的代码调试功能,是一个功能强大的可视化软件集成开发工具。本项目将使用Visual Studio 2010进行代码的编辑、编译与调试。
B)Visual Assist
为了提高代码编写的效率,可安装Visual Assist X插件。Visual Assist X插件是WholeTomato公司针对Visual Studio开发环境开发的一款代码编写辅助工具,能够实现变量名、函数名的自动提示与补全,以及函数定义与声明之间的快速切换,从而达到提高开发效率的目的。
C)OpenCV
OpenCV(Open Computer Vision)是一个开源的跨平台计算机视觉库,可以运行于Linux、Windows和Mac OS操作系统上。它轻量级而且高效,实现了图像处理和计算机视觉方面的很多通用算法。本项目可利用OpenCV实现图像的读取、显示以及一些基本的预处理算法。
网址: /
任务描述
背景资料概述
机器学习:利用计算机模拟或实现人类的学习行为,以获取新的知识或技能。因此,机器学习算法通常包括两个阶段:训练和分类。训练阶段,即利用一些已知的训练样本训练得到机器学习算法模型的相应参数。该阶段类似于小孩认字时的学习阶段,老师告诉小孩各种字具有什么样的特征。分类阶段,即对于训练好的算法模型,给定输入数据,计算机自动给出数据的分类。该阶段类似于小孩在进行了学习后可以自主的识字。目前常用的机器学习算法包括:支持向量机(SVM,Support Vector Model)、BP神经网络、决策树
系统组成
基于机器学习的手写字符识别系统通常包括四个部分:图像预处理、特征提取、字符训练与字符识别四个阶段,如 REF _Ref395884962 \h 图 1所示。
图 SEQ 图 \* ARABIC 1 字符识别系统的功能框架
图像预处理:主要包括图像的去噪(中值滤波、高斯滤波),图像的二值化(将彩色图像或灰度图像转化为二值图像),形态学处理(利用闭操作,即先膨胀再腐蚀,将断裂的笔画进行修复)。
特征提取:字符图像由一系列二进制的0和1组成,虽然这些数据包含了字符的全部信息,但是这些
文档评论(0)