- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
手写体数字识别实验报告
软件学院12-13-2 学期《人工智能》课程项目报告
题目:使用SMO 方法进行手写体数字识别
目录
软件学院12-13-2 学期《人工智能》课程项目报告1
1 问题描述2
2 二值化处理2
2.1 思想: 2
2.2 OSTU 算法:2
2.3 OTSU 算法伪代码:2
3 降维处理2
4 .半监督算法4
4.1 半监督算法流程:4
4.2 半监督算法的主要算法:4
1)self-Training models :4
2 )Propagating-1-nearest-neighbor:4
3 )CLUSTER-THEN-LABELMETHODS4
4 )Co_Training:4
5 )基于图的算法(Graph based Learning ):5
4.4 半监督学习分类算法的现实价值:5
5 我使用SVM 的SMO 算法5
5.1 SMO 算法基本思想:5
5.2 应用SMO 算法的流程:5
6 性能分析6
6.1.监督学习6
6.2.半监督学习(Tri-training )6
6.3 我们用J48,SMO, NaiveBayes 以及BayesNet 四种算法对降维后的算法进行训练并求
出其准确性,得到如下数据7
7 思考总结7
1 问题描述
手写体数字识别问题,简而言之就是识别出10 个阿拉伯数字,由于数字的清晰程度或者是个人的写字习惯抑或是其他,往往
手写体数字的形状,大小,深浅,位置会不大一样。
现在我们拥有3006 个带标记的数据以及56994 的未带标记的数据,而我们的目标就是正确识别出这些手写体数字。因此我
们可以把这些带标记的数据看作经验值,运用一定算法来学习,预测出这些未带标记的数据。
对问题的分析如下:
1 考虑到每个值都是0-255 之间的一个整型值,对于算法的分析操作会影响性能,我将每个值进行了二值化,变成0,1。
2 考虑到这些数据都是28 ×28=784 维的,维数太大,在后续的学习过程中效率会很低,我对它进行了降维处理。
3 考虑到未带标记的数据量远远超过了未带标记的数据,我运用了半监督学习方法,利用那些未带标记的数据来帮助我们
学习。
2 二值化处理
2.1 思想:
图像的二值化处理就是讲图像上的点的灰度置为0 或255,也就是讲整个图像呈现出明显的黑白效果。即将256 个亮度等级
的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像.为了得到理想的二值图像,一般采用封
闭、连通的边界定义不交叠的区域。所有灰度大于或等于阀值的像素被判定为属于特定物体,其灰度值为 255 表示,否则这些
像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。如果某特定物体在内部有均匀一致的灰度值,并且
其处在一个具有其他等级灰度值的均匀背景下,使用阀值法就可以得到比较的分割效果。如果物体同背景的差别表现不在灰度
值上(比如纹理不同),可以将这个差别特征转换为灰度的差别,然后利用阀值选取技术来分割该图像。动态调节阀值实现图像
的二值化可动态观察其分割图像的具体结果。
2.2 OSTU 算法:
OTSU 算法也称最大类间差法,有时也称之为大津算法,被认为是图像分割中阈值选取的最佳算法,计算简单,不受图像亮
度和对比度的影响,因此在数字图像处理上得到了广泛的应用。它是按图像的灰度特性,将图像分成背景和前景两部分。背景和
前景之间的类间方差越大,说明构成图像的两部分的差别越大, 当部分前景错分为背景或部分背景错分为前景都会导致两部分差
别变小。因此,使类间方差最大的分割意味着错分概率最小。
OSTU 算法目的就是计算出一连通区域的阈值,然后对该区域二值化。 数学描述为:令连通区域S,其中象素灰度范围为
[0,255],点(x,y)的灰度表示为I(x,y),灰度级x 的点的概率为P(x);则OSTU 就是求下式达到最大值的灰度级m
2.3 OTSU 算法伪代码:
您可能关注的文档
- 家庭中的物理知识.ppt
- 客户选择收款机的误区.doc
- 室管膜下巨细胞星形细胞瘤的MRI诊断.pdf
- 宪法一词的西文起源及其演进考_徐国栋.pdf
- 家庭卫生筹资公平性研究.pdf
- 容忍非信任组件的可信终端模型研究.pdf
- 宽波段背腔槽隙螺旋天线的设计.doc
- 宽高比对矩形窄缝通道内流体温度场的影响_曾和义.pdf
- 密码的设计解密与破译(上课版).ppt
- 密码学上的Hash函数研究现状及进展.pdf
- CNAS-CL63-2017 司法鉴定-法庭科学机构能力认可准则在声像资料鉴定领域的应用说明.docx
- 12J7-3 河北《内装修-吊顶》.docx
- 12N2 河北省12系列建筑标准设计图集 燃气(油)供热锅炉房工程.docx
- 内蒙古 12S8 排水工程 DBJ03-22-2014.docx
- 山西省 12S10 12系列建筑标准设计 管道支架、吊架.docx
- 16J601-木门窗标准图集.docx
- 12J8 河北省12系列《 楼梯》.docx
- CNAS-GL37 2015 校准和测量能力(CMC)表示指南.docx
- CNAS-RL02-2016 能力验证规则.docx
- 津02SJ601 PVC塑料门窗标准.docx
最近下载
- 2024年广州市高三二模(普通高中毕业班综合测试(二)数学试卷(含官方答案及逐题解析).pdf
- 武汉市2025届高中毕业生四月调研考试(四调)数学试卷(含答案详解).pdf
- (毕业论文)果树采摘机器人的发展现状及运动学分析.doc VIP
- 【高中语文】双新背景下的语文教学设计+85.pptx VIP
- 雨课堂学堂在线《兵棋(中国人民武装警察部队警官学院)》学堂云单元测试考核答案.pdf VIP
- 11.3 一元一次不等式组(教学设计)七年级数学下册(人教版2024).docx
- 年产1万吨一氯甲烷的工艺流程设计.doc
- 医疗器械质量管理制度-全套规章制度.docx VIP
- 木材质量v验收标准.doc
- 直肠癌(外科学课件).ppt VIP
文档评论(0)