- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘 第三章 定性归纳
从数据分析角度出发,数据挖掘可以分为两种类型:描述型数据挖掘和预测
型数据挖掘。前者是以简洁概述的方式表达数据中的存在一些有意义的性质;而
后者则通过对所提供数据集应用特定方法分析所获得的一个或一组数据模型,并
将该模型用于预测未来新数据的有关性质。
数据库通常包含了大量细节性数据,然而用户却常常想要得到能以简洁描述
性方式所提供的概要性总结( )。这样的数据摘要能够提供一类数据
的整体情况描述;或与其它类别数据相比较的有关情况的整体描述。此外用户通
常希望能轻松灵活地获得从不同角度和分析细度对数据所进行的描述。描述型数
据挖掘又称为概念描述( ),它是数据挖掘中的一个重要组成
部分 本章就将主要介绍如何有效地进行定性归纳以获得概念描述的有关内容。
通常一个数据库管理系统会提供多个数据管理与操作工具以帮助用户(或专
家)从大型数据库获取各种数据。这类数据获取工具一般都是利用数据查询语言,
如:,这类工具可以从一个在线电话号码簿上查询出一个人的电话号码;或
者获得 年某个商店所进行的事务处理。但是这类处理并不是数据挖掘,数
据查询处理( )负责从数据库中取出数据并在必要时进行一些数
据合计处理;而数据挖掘则对数据进行深度分析并发现隐藏在数据中有意义的模
式。
最简单的描述型数据挖掘就是定性归纳。定性归纳常常也称为概念描述
( )。这里概念描述涉及一组(同一类别)的对象,诸如:商
店常客等,作为一种数据挖掘方法,概念描述(数据挖掘)并不是简单地进行数
据合计操作,而是生成对数据的定性描述和对比定性描述。定性概念描述提供了
一个有关数据整体的简洁清晰描述;而对比定性概念描述( )则提
供了基于多组(不同类别)数据的对比概念描述。因此概念描述主要包含:概念
描述与对比描述两个主要部分,以下将要介绍两项挖掘工作的实现方法。
描述一组数据有多种方法,不同的人常常会需要不同角度或不同抽象水平的
概念描述。一个概念的描述通常也不是唯一的,但基于不同的主观与客观标准,
会有一些概念描述内涵优于其它概念描述。这里的客观标准一般指描述的简洁性
及其所涵盖的范围;主观标准则与用户背景知识及其所涉及的有关信念相关。
数据挖掘 第三章 定性归纳
概念描述与数据泛化 ( )密切相关。给定存储在数据库中
的大量数据,能够用简洁清晰的高层次抽象泛化名称来描述相应的定性概念是非
常重要的,这样用户就可以利用基于多层次数据抽象的功能对数据中所存在的一
般性规律进行探索 。例如:一个商场数据库中,销售主管不用对每个顾客的购买
记录进行检查,而只需要对更高抽象层次的数据进行研究即可,如:对按地理位
置进行划分的顾客购买总额、每组顾客的购买频率以及顾客收入情况进行更高层
次的研究分析。这种多维多层次的数据泛化分析与数据仓库中的多维数据分析,
即在线分析处理(简称 )功能相似 ,那么这两者究竟有何 区别呢?
数据仓库和 工具是基于多维数据模型的,它是以数据立方形式对
数据进行处理的。其处理内容主要包括 两方面:维 (属性)和处理功能
(如:合计)。而在 目前大多数数据仓库系统中,其所能处理的属性类型
和处理功能都是有限的。 目前许多 所处理的属性只能是非数值类
型的;而处理功能(如: 、、 )也仅 能用于对数值
数据的处理;与之相比,在概念描述形成过程 中,数据库中的数据可以
是各种类型
文档评论(0)