數据仓库复习重点.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
數据仓库复习重点

数据仓库的用途(数据仓库与事务性数据库的区别) 1.事务性数据库帮助人们执行活动,数据仓库帮助人们制定计划 2.事务性数据库侧重于细节,数据仓库侧重于高层次的聚合 3.事务性数据库通常为特定的应用程序而设计,而数据仓库集成了不同源头的数据 4.事务性数据库关心的是现在,数据仓库关心的是随时间变化的活动 5.事务性数据库是易变的,数据仓库是稳定的 6.事务性数据库必须能够对详细信息快速获取或更新,数据仓库必须能够对高度汇总的信息快速获取。 事实表:在多维数据仓库中,保存度量值的详细值或事实的表。 度量值:在数据仓库中,用来监视业务的可以汇总的数值。 成员:维度中的项目称为维度的成员 主键列:数据库维度表中的一个列,它包含的值唯一地表示每行数据。主键列在维度表。 外键列 数据库表中的一个列,某个其他数据库表的主键列的每个值都可能在其中出现多次。 雪花型设计:一种数据库布局,其中维度的属性被保存在单独的(规范化的)表中。 星型设计 一种数据库布局,其中维度的多个属性被冗余地保存在单个(反规范化的)维度表中 第2章: 计算成员:一种使用比存储在多维数据集中更复杂的公式来聚合度量值的机制 多维数据集:一个或多个度量值组以及它们相关的维度的集合 度量值组 单个事实表中明细数值的概念容器,附带一个或多个维度层次结构的所有可能聚合 第3章 由顶至底开发方法 即是首先要创建一个没有数据源的多维数据集,然后再生成关系架构并加载数据源 商业智能开发平台 Visual Studio中的商业智能设计器称为商业智能开发工作台。在BIDS环境中,可以创建为高性能分析组织数据的分析服务项目,可以创建为分析服务项目准备和加载数据的集成服务包,还可以创建把分析结果呈现给业务用户社区的报表服务报表。 SQL Server管理工作台 对生产数据库进行常规维护工作——例如处理数据库项目 分析服务项目(主要构成) 主要构成:“数据源”、“数据源视图”、“多维数据集”、“维度”、“挖掘结构”、“角色”、“程序集”和“其他”。 第4章: 由底至顶开发方法 即是首先添加数据源,接着创建数据源视图,然后使用维度向导创建维度的初始结构,最后创建多维数据集 角色共享维度 同一维度可以在事实表中担任不同的角色,当事实表中多个外键连接到同一个维度表时,可以认为该维度是一个角色共享维度。 (向多维数据集中添加角色共享维度:确保在事实表和维度表之间定义了多个关系。通过维度向导创建维度,打开多维数据集设计器,右击“多维数据集结构”选项卡上“维度”窗格的背景,单击“添加多维数据集维度”,单击列表中的维度,然后单击“确定”按钮) 父子维度 父子维度是指构建一个包含一个内置的递归层次结构的表,可以使用这个层次结构中的每个分支的所有级别来聚合数值。 (手工创建父子维度:遵循创建标准维度的过程,在维度向导“定义父子关系”页面选中“这个维度的属性中含有父子关系”复选框,最后指定父属性键) 第5章: 度量值组 (重命名度量值组:在多维数据集设计器的“多维数据集结构”选项卡中,右击度量值组,然后选择“重命名”,或在属性窗口中更改Name属性;向已有的多维数据集添加度量值组:在多维数据集设计器的“多维数据集结构”选项卡中,右击“度量值”窗格的任何区域,选择“新建度量值”,然后选择相应的事实表) 粒度属性 当关系类型为常规时,必须指定一个粒度属性,它是表示事实表中对应最低粒度明细信息的维度属性。 半累加性度量值 半累加性度量值只能按照多维数据集中部分维度进行累加,而不是全部。通常用于固定时间点数值(也称为快照)。(把半累加性度量值添加到多维数据集时,不管是通过多维数据集向导还是通过多维数据集设计器手工添加的,都要更改它的默认聚合行为) 无重复计数度量值 无重复计数度量值返回事实表中唯一成员的计数。必须包含在单独的度量值组中。 (添加无重复计数器度量值:在多维数据集设计器的“多维数据集结构”选项卡中,右击“度量值”窗格的任何区域,单击“新建度量值”,从“用法”下拉列表中选择“无重复计数”,然后从“源表”下拉列表中选择事实表,然后单击源列。) 第6章: 一元操作符 加法为+,减法为 — ,乘法为*,除法为/,~表示不对成员进行聚合。这些代码称为一元操作符。 第7章: 聚合设计 1.因为要避免数据爆炸,方法就是避免把聚合数据都存储起来,在需要的时候再计算它们。2.而且,对于大型的多维数据集,聚合会对查询速度产生巨大的影响,帮助分析服务快速地响应查询。 3.不需要存储多维数据集所有可能的聚合值。分析服务可以使用已有的聚合尽快地计算出需要的数值。 聚合值:聚合值是从多维数据集中获取的单个总计值。 聚合 聚合包含了多维数据集中一个属性层次结构与所有其他层次结构所有可能的组合。是累加性度量值预先计算好的总计值。

文档评论(0)

fv45ffsjjI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档