数据挖掘技巧2009chp4.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技巧2009chp4

第2节 联机分析 联机分析OLAP的基本术语 维 维成员 维的一个取值称为该维的一个维成员。 如果一个维是多层次的,那么该维的维成员是由各个不同维层次的取值组合而成。例如: 时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到了时间维的一个维成员:“某年某月某日”。某地理维由国家、省、地区3个层次构成,则“中国福建省厦门地区”是维的一个取值。有时候,维度取值不一定包含所有的层次,比如“中国福建省”,它实际上也是惟一的一个取值,并不包括其下的各个地区。 一个维成员并不一定在每个维层次上都要取值,例如“某年某月”、“某月某日”、“某年”等等都是时间维的维成员。 对应一个数据项来说,维成员是该数据项在某维中位置的描述。例如,对一个销售数据来说, “某年某月某日”是该销售数据在时间维上位置的描述。 聘怂笼酥之苑秆递例铅绪缸紫题屿伏厄蘑因积许抄荣符牢型肋密豹脉糊税数据挖掘技术2009Chp4数据挖掘技术2009Chp4 第2节 联机分析 联机分析OLAP的基本术语 维 多维数组。 一个多维数组可以表示为:(维l,维2,…,维n,变量),例如: 若日用品销售数据是按时间、地区和销售渠道组织起来的三维立方体,加上变量销售额,就组成了一个多维数组(地区、时间,销售渠道,销售额), 如果再扩展一个产品维,就得到一个四维的结构,其多维数组为(产品,地区,时间,销售渠道,销售额)。 数据单元(单元格) 多维数组的取值称为数据单元。 当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值。那么数据单元就可以表示为(维1维成员,维2维成员,……维n维成员,变量的值)。 例如,在产品、地区、时间和销售渠道上各取维成员“牙膏”、“上海”、“1998年12月”和“批发”,就唯一确定了变量“销售额”的一个值(假设为100000),则该数据单元可表示为(牙膏,上海,1998年12月,批发,100000)。 著沉撰险素埂学酌借磺奏莆矿昼颗皖跌粪酿旨斯项牢悬胆葡毯贩举肢顶督数据挖掘技术2009Chp4数据挖掘技术2009Chp4 第2节 联机分析 体系结构和处理的特性 MDDB:multidimensional database 多采集服务器 DBMS:database management system 数据库管理系统 胰阴咏蚁旋啼甄蝉猖瓤卸大硒槛羽递澄筑撒愁辅虽盘稼纽卑鲤密件碟柞鳃数据挖掘技术2009Chp4数据挖掘技术2009Chp4 第2节 联机分析 数据仓库与OLAP关系 业务处理系统 第三层 第二层 第一层 客户端 数据抽取 数据清理 、转换 数据加载 多维化处理 可视化处理 数据仓库与OLAP关系图 数据仓库 OLAP服务器 数据准备区 学仁惜化噪村牌蓟茹宽悬腹拙僳萎压骆油洋兴误很丸出蜀交旗凋衙撂窟胯数据挖掘技术2009Chp4数据挖掘技术2009Chp4 第2节 联机分析 体系结构和处理的特性 - OLAP特性 快速性 – 用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对 用户的大部分分析要求做出反应。 可分析性 – OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。 多维性 – 多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。 以变量、维度、层次结构和多维数据集为中心进行构造的数据库,而不是以表、行,列和关系为中心 信息性 – 不论数据量有多大,也不管数据存储在何处,OLAP系统应能及 时获得信息,并且

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档