- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图象识别中的归学习方法研究
中国翌堂垫查垄兰堡主堂堡垒查——
论文摘要
本论文研究的是粤叁堡型中的些塑差翟友鎏。图象识别的特点是模式类别极多、识别
系统庞大并且在实际使用过程中经常需要增加可识别的模式类别。归纳学习是机器学习最
成熟、最核心的分支,也是模式识别理论与人工智能相衔接的关键之一。将模式识别与人
工智能中的归纳学习结合起来形成智能模式识别方法是近年来模式识别理论从基于概率论
的统计模式识别和基于形式语言的结构模式识别走向智能化、分类方法概念化的突破t也
是归纳学习走向实际应用的重要里程碑。
f毫无疑问,任何一门技术学科都是在实践中产生并在实际应用的过程中得到不断地完
善和发展的。在1990’年代初期,归纳学习开始了面向实际应用的阶段。正是在这一时期,
人们发现了经典的归纳学习理论和算法的严重不足,即经典的归纳学习的理论和算法忽视
的判决精度问题,而过分地强调了学习结果在概念上的简洁性。这种似乎是突如其来的问
题使人们从沉醉于Occam算法和理论中清醒过来,于是各种基于实验的、被一些持经典的
人工智能思想的名家称为“非理论方法”的决策森林算法和多变决策树算法纷纷提出。诚
然,这些几乎不可能对学习结果在概念上进行理解的有争议的方法在提高分类器的判决精
度方面确实取得了一定的进步,但对于归纳学习本身而言却仍然是难以解决的障碍。因为
一旦学习的结果在概念上失去了可理解性,演绎学习等其它的人工智能方法将失去基础。
诚然,判决精度问题是目前归纳学习研究领域的重点。尽管目前决策森林算法和多变决策
树算法的研究状况让人们看到了提高判决精度的希望,然而它们都是以牺牲概念的可理解
性和巨大的计算复杂性为代价来换取判决精度的并不十分可观的提高。对判决精度、计算
复杂性和概念的可理解性的要求仍然是人们面临的非常困难的问题。
综上所述,在目前的研究背景下简单地用经典的归纳学习算法进行学习来构成模式识
别用的分类器是不审慎的,因为构成具有高判决精度的分类器是模式识别的最终目的:而
如果不加考虑地任意采用一种现成的决策森林算法或多变决策树算法来解决实际问题也不
一定就能取得更理想的效果。一方面,以巨大的计算复杂性为代价的学习方法本身在提高
判决精度方面不是无条件的,人们己经发现了这类方法的局限性并在理论上进行了论证。
另一方面,即使实际的应用对象满足这类算法的前提条件,它们也只能局限于在小规模数
据集合上的实验a因为巨大的计算复杂性限制了它们处理庞大的实际应用数据的能力。并
且,只有概念学习才有提供人们对识别系统的理解并以此对系统的局部模块进行干预的可
中国型堂垫查垄兰量主堂堡笙查——
———————————————————————————————————————————一
能陛。矿‘
为了探索如何在归纳学习及其应用研究方面容入新的思路,本文着重考虑了基≤§i基烈
与决策树归纳学习之间的密切关系,并试图用模式识别的理论和方法对归纳学习进行研究。
^△文的研究工作包括以下7个方面:
k
(1)在绪论部分,论文分析了目前机器学习领域的研究动态、主要计算方法以及相关
领域的互动关系,阐述了模式识别理论与决策树归纳学习的内在联系,指出了机器学习研
究中提高判决精度的切入点。即,模式识别曾对归纳学习的发展起到过重要作用和影响,
也是归纳学习最成功、最重要的应用领域之一。判决精度是模式识别和归纳学习的共同问
题,在考虑提高归纳学习判决精度的时候应当充分发挥模式识别中成熟理论的作用。
(2)分析了特征选择与决策树算法的一致性关系,从信号分析的角度出发,通过观察
窗口变化时信号能量的变化情况,提出了一种基于自相关函数的决策树归纳学习算法
ACDT。与虽适合离散数值学习的1D3算法相比.ACDT具有更高的判决精度。
(3)模式类可分性度量准则是模式识别领域中的重要理论,然而它一直没有受到归纳
学习研究的足够的重视。将模式类可分性度量准则引入归纳学习是本文的创新之一。通过
对内类、内间距离准则进行分析并做局部修正.提出了一种基于类内、类间距离的ICD2
5并接近决策森林的
决策树算法。实验表明,ICD2的判决精度高于连续数值学习算法C4
效果,而目计算速度比C45更快。ICD2另一个特点是它可以对特征的有效性进行度量。
(4)为了避免极多模式学习时所产生的Overfitting问
文档评论(0)