2023年数据仓库与数据挖掘讲课笔记.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二周:2023/9/4

第三讲:数据仓库的多维数据模型

数据仓库多维数据模型(Mulli-DimcnsionalDaiaModel)是为满足顾客从多角度多层次

进行数据查询和分析的需要而建立起来的基于事实和维日勺数据库模型,其基本的应用是为

实现OLAP(OnlineAnalyticalProcessing)。

I.度量值(Measure)

度量值是决策者所关怀口勺具有实际意义的数值。例如,销售量、库存量、银行贷款金

额等。度最值是所分析口勺多维数据集日勺关键,它是最终顾客浏览多维数据集时重点查看的

数值数据。

2.事实数据表(FactTabic)

度量值所在的表称为事实数据表,事实数据表中寄存的事实数据一般包括大量的J数据

行。事实数据表口勺重要特点是包括数值数据(事实),而这些数值数据可以记录汇总以提

供有关单位运作历史的信息。

3.维度组员(DimensionMember)

维H勺一种取值称为该维H勺一种维度组员(简称维组员)。假如一种维是多级别的,那

么该维的维度组员是在不一样维级别的取值的组合。例如,考虑时间维具有日、月、年这

3个级别,分别在日、月、年上各取一种值组合起来,就得到时间维的|一种维组员,即

“某年某月某日“。

4.维度表(DimensionTable)

包括维度信息的表是维度表,维度表包括描述事实数据表中的事实记录的特性。

度量值

维度表和事实

表互相独立,又互

有关联并构成一种

统一的模式。构建

多维数据集时常用的架构:

1.星型模式

星型模式是一种多维的数据关系,它由一种事实表IFactTable)和一组维表(Dimension

Table)构成。每个维表均有一种维作为主键,所有这些维的主键组合成事实表的主键。事实

表的非主键属性称为事实(Fact),它们一般都是数值或其他可以进行计算U勺数据;而维表大都

是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不一样的维(事实表的

主键II勺部分或所有)来对这些事实数据进行求和(summary)、求平均(average)、计数(count)、

比例(percent)的汇集计算,甚至可以做20-80分析。这样就可以从不一样的角度数字来分析

业务主题II勺状况

♦:川崎

FK蛀网U

JJ

(1

H

文档评论(0)

zsmfjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档