根据k近邻手写数字识别.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
暑期生产实习报告 题 目 基于 K-近邻算法的手写数字识别 学 院 电子工程学院 专 业 智能科学与技术 学生姓名 学 号 指导老师 提交日期 摘要 基于 k-近邻算法对经典的手写数字集 mnist 中的测试数据进行分类。用 MATLAB 语言编写代码,将原始数据读入,形成三维矩阵,再通过 k 近邻算法计 算出待测数据周围最近的 k 个数据,将待测数据分为 k 个数据中最多的类。本次 实验只是用 mnist 数据中训练图像前 6000 张,测试图像前 1000 张。 关键词:k-近邻算法,数据分类,手写数字集,mnist 数据集 目录 一、绪论 1.1 手写数字识别的基本概念 手写数字识别是图像识别的一个分支,它研究的对象是:如何利用电子计算 机自动辨认人手写的阿拉伯数字。 在整个 OCR 领域中,最为困难的就是脱机手写字符的识别。到目前为止, 尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还 有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开 始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。 1.2 手写数字识别的实际背景 字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用 各国家、各民族的文字(如:汉字、英文等)书写或印刷的文本信息,目前在印 刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信 息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政 编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数 字识别。这几年来我国开始大力推广的“三金”工程在很大程度上要依赖数据信 息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一 事业的进展。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并 投入应用,将产生巨大的社会和经济效益。 1.3 手写数字识别的理论意义 手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值: (1)阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究 基本上与文化背景无关,这样就为各国、各地区的研究工作者提供了一个施展才 智的大舞台。在这一领域大家可以探讨,比较各种研究方法。 (2 )由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。 这方面最明显的例子就是人工神经网络,相当一部分的人工神经网络模型都以手 写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。 (3 )尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很 多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个 有难度的开放问题。 (4 )手写数字的识别方法很容易推广到其它一些相关问题,一个直接的 应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母 的识别放在一块儿研究的。 1.4 基于手写数字识别的典型应用 手写数字识别有着极为广泛的应用前景,这也正是它受到世界各国的研究工 作者重视的一个主要原因。下面我们将介绍基于手写数字识别的应用系统的特殊 要求,以及一些以手写数字识别技术为基础的典型应用。 (1) 手写数字识别在大规模数据统计中的应用 在大规模的数据统计(如:行业年鉴、人口普查等)中,需要输入大量的数 据,以前完全要手工输入,则需要耗费大量的人力和物力。近年来在这类工作中 采用 OCR 技术已成为一种趋势。 因为在这种应用中,数据的录入是集中组织的,所以往往可以通过专门设计 表格和对书写施加限制以便于机器的自动识别。目前国内的大多数实用系统都要 求用户按指定规范在方格内填写。另外,这些系统往往采用合适的用户界面对识 别结果做全面的检查,最终保证结果正确无误。可以看出,这是一类相对容易的 应用,对识别核心算法的要求比较低,是目前国内很多单位应用开发的热点。 (2 ) 手写数字识别在财务、税务、金融领域中的应用 财务、税务、金融是手写数字识别大有可为的又一领域。随着我国经济的迅 速发展,每天等待处理的财

文档评论(0)

汪汪队 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档