- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖取.doc
??数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。
?????? 由于数据挖掘是一门受到来自各种不同领域的研究者关注的交叉性学科,因此导致了很多不同的术语名称。其中,最常用的术语是知识发现和数据挖掘。相对来讲,数据挖掘主要流行于统计界(最早出现于统计文献中)、数据分析、数据库和管理信息系统界;而知识发现则主要流行于人工智能和机器学习界。
??????数据挖掘可粗略地理解为三部曲:数据准备(data preparation)、数据挖掘,以及结果的解释评估(interpretation and evaluation)。
??????根据数据挖掘的任务分,有如下几种:分类或预测模型数据挖掘、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等。
??????根据数据挖掘的对象分,有如下若干种数据源:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据、异质数据库、遗产(legacy)数据库,以及Web数据源。
??????根据数据挖掘的方法分,可粗分为:统计方法、机器学习方法、神经网络方法和数据库方法。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)、以及模糊集、粗糙集、支持向量机等。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例的推理CBR、遗传算法、贝叶斯信念网络等。神经网络方法,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是基于可视化的多维数据分析或OLAP方法,另外还有面向属性的归纳方法。图像数据挖掘过程和方法的研究
推荐本文
□ 纪秀辉 周 亮
[摘要]数据挖掘技术应用于图像处理可以在一定程度上解决图像内容的表示、存储和检索过程中存在的一些难点。针对图像数据挖掘过程和方法的研究基础上详细讨论图像数据预处理、挖掘技术等问题,给出未来可发展和研究的方向。 [关键词]图像检索 图像处理图像数据挖掘 中图分类号:TP3 文献标识码;A 文章编号:1671—7597(2009)0210054—01 一、引言 随着数字化时代的到来,数码相机、监视相机、卫星遥感系统的应用越来越广泛,涌现出大量的图像数据。这些图像里有很多对用户有用的信息,但是,缺乏有效的方法从这些图像中搜索和发现有用的模式。图像数据挖掘被要求能够从图像数据中自动地提取有用的语义信息。从数据的转化、同步、连续数据流的管理到图像数据的检索及目前的图像数据挖掘一直是人们关注的热点。 二、图像数据挖掘的过程 (一)数据预处理。在大型图像数据库中存在许多脏数据和已破坏了的数据,如极不清晰的图片、已遭破坏的图像等,这些数据能使挖掘过程陷入混乱,导致不可靠的输出,因此有必要对数据进行预处理,去掉脏数据和已破坏了的数据以及去掉数据中的噪音。 (二)图像数据挖掘过程图解。图像数据挖掘的一个十分关键的问题是图像数据本身的表示问题,这也是图像处理和模式识别的关键问题。一般而言,可以用颜色、纹理、形状和运动向量等来表示图像的基本特征。高级概念可以看成是一种特征模式。比如,河流可以认为是具有某种颜色特征的长条形;大片庄稼区可以认为是具有某种颜色分布和纹理特征的大片图像区域。高级概念是我们所关心的,它可能是某种物体的存在、某种现象的发生等。底层的基本特征与高层概念之间必然存在着某种映射关系,这种关系可以用数据挖掘的方法来发现这样,图像数据挖掘的基本过程可以用图1所示的图来表示。 三、图像挖掘中研究的问题 人们对图像挖掘研究的问题主要在于挖掘系统的建立和挖掘算法的发现,为了得到新的图像模式的发掘算法,还有一系列其它相关的研究主题需要解决。例如,为了使发现的图像模式有意义,它们必须对用户可视。这个可以解释为下列的主题: (1)图像模式的表达:如何将上下文信息,空间信息和重要的图像特征包含在表达机制中; (2)图像特征的选择:哪个才是重要的图像特征被用于图像处理过程,这样发现的模式是有可视意义的; (3)图像模式可视化问题:在视觉丰富的环境里如何表达挖掘的模式给用户。 四、图像挖掘的技术 除了研究合适的图像挖掘框架,早期的图像挖掘者已经试图试用已有的技术挖掘图像信息。常用的技术包括图像分类与聚类,图像数据的相似性搜索,
原创力文档


文档评论(0)