网站大量收购独家精品文档,联系QQ:2885784924

手写体数字识别实验报告.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
手写体数字识别实验报告

软件学院12-13-2 学期《人工智能》课程项目报告 题目:使用SMO 方法进行手写体数字识别 目录 软件学院12-13-2 学期《人工智能》课程项目报告1 1 问题描述2 2 二值化处理2 2.1 思想: 2 2.2 OSTU 算法:2 2.3 OTSU 算法伪代码:2 3 降维处理2 4 .半监督算法4 4.1 半监督算法流程:4 4.2 半监督算法的主要算法:4 1)self-Training models :4 2 )Propagating-1-nearest-neighbor:4 3 )CLUSTER-THEN-LABELMETHODS4 4 )Co_Training:4 5 )基于图的算法(Graph based Learning ):5 4.4 半监督学习分类算法的现实价值:5 5 我使用SVM 的SMO 算法5 5.1 SMO 算法基本思想:5 5.2 应用SMO 算法的流程:5 6 性能分析6 6.1.监督学习6 6.2.半监督学习(Tri-training )6 6.3 我们用J48,SMO, NaiveBayes 以及BayesNet 四种算法对降维后的算法进行训练并求 出其准确性,得到如下数据7 7 思考总结7 1 问题描述 手写体数字识别问题,简而言之就是识别出10 个阿拉伯数字,由于数字的清晰程度或者是个人的写字习惯抑或是其他,往往 手写体数字的形状,大小,深浅,位置会不大一样。 现在我们拥有3006 个带标记的数据以及56994 的未带标记的数据,而我们的目标就是正确识别出这些手写体数字。因此我 们可以把这些带标记的数据看作经验值,运用一定算法来学习,预测出这些未带标记的数据。 对问题的分析如下: 1 考虑到每个值都是0-255 之间的一个整型值,对于算法的分析操作会影响性能,我将每个值进行了二值化,变成0,1。 2 考虑到这些数据都是28 ×28=784 维的,维数太大,在后续的学习过程中效率会很低,我对它进行了降维处理。 3 考虑到未带标记的数据量远远超过了未带标记的数据,我运用了半监督学习方法,利用那些未带标记的数据来帮助我们 学习。 2 二值化处理 2.1 思想: 图像的二值化处理就是讲图像上的点的灰度置为0 或255,也就是讲整个图像呈现出明显的黑白效果。即将256 个亮度等级 的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像.为了得到理想的二值图像,一般采用封 闭、连通的边界定义不交叠的区域。所有灰度大于或等于阀值的像素被判定为属于特定物体,其灰度值为 255 表示,否则这些 像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。如果某特定物体在内部有均匀一致的灰度值,并且 其处在一个具有其他等级灰度值的均匀背景下,使用阀值法就可以得到比较的分割效果。如果物体同背景的差别表现不在灰度 值上(比如纹理不同),可以将这个差别特征转换为灰度的差别,然后利用阀值选取技术来分割该图像。动态调节阀值实现图像 的二值化可动态观察其分割图像的具体结果。 2.2 OSTU 算法: OTSU 算法也称最大类间差法,有时也称之为大津算法,被认为是图像分割中阈值选取的最佳算法,计算简单,不受图像亮 度和对比度的影响,因此在数字图像处理上得到了广泛的应用。它是按图像的灰度特性,将图像分成背景和前景两部分。背景和 前景之间的类间方差越大,说明构成图像的两部分的差别越大, 当部分前景错分为背景或部分背景错分为前景都会导致两部分差 别变小。因此,使类间方差最大的分割意味着错分概率最小。 OSTU 算法目的就是计算出一连通区域的阈值,然后对该区域二值化。 数学描述为:令连通区域S,其中象素灰度范围为 [0,255],点(x,y)的灰度表示为I(x,y),灰度级x 的点的概率为P(x);则OSTU 就是求下式达到最大值的灰度级m 2.3 OTSU 算法伪代码:

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档