2012春《数据仓库与数据挖掘》复习提纲.docVIP

2012春《数据仓库与数据挖掘》复习提纲.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘》复习提纲 商务智能 Kimball对数据仓库的定义 Inmon对数据仓库的定义 Kimball对数据仓库的定义 ETL 数据仓库总线矩阵 事实 维度 粒度 维度模型 业务过程维度模型 多维数据集(又称为数据立方体) 部署 OLAP 代理键 渐变维度 聚合 星型模型 雪花模型 事实星座模型 多维数据库 SQL Server 2005的维度层次 SQL Server 2005的属性层次 数据仓库各环节工具(如ETL)的市场占有率最高的公司【在前言中】 数据库和数据仓库的区别【参考答案:(1)应用目的不同:数据库主要用于构建联机事务处理(OLTP)系统,这种系统自己产生新数据,每次事务处理涉及的记录数较少,通常为几条;而数据仓库主要用于构建分析型决策支持系统,这种系统自己不产生新数据,所使用的数据来自于OLTP系统或其他数据源。(2)数据的时间跨度不同:数据库通常存放较新的业务数据;而数据仓库中存放的是历史业务数据,其时间跨度为5~10年。(3)数据的业务范围不同:数据库系统通常关注局部业务范围的事务处理;数据仓库通常要关注整个企业的全部业务。(4)所采用的设计技术不同:数据库面向事务,采用三范式(3NF)建模;数据仓库则面向主题,采用三范式(3NF)或维度模型建模。(5)注重的技术不同:数据库系统存在大量的数据查询和数据更新,需要重点考虑包括数据更新和并发控制技术在内的各种数据处理技术,而数据仓库以数据查询为主,数据更新较少,所以不需过多的考虑数据更新和并发控制,主要考虑数据查询性能的提升。】 典型的数据仓库/商务智能(DW/BI)系统三层体系结构【在前言中】 数据仓库的两大技术流派及主要差异【在前言中】 Kimball流派主张基于哪四个主要原则的迭代方法来构建数据仓库体系【在前言中】 列出BI行业2007-2008年最大的三笔企业收购案和现在的四大主宰公司【在前言中】 业务需求定义的主要步骤(在第1章) 企业级业务需求定义【业务需求定义的环节之一】过程的主要步骤(在第1章) 如何使用2×2矩阵确定各业务过程所对应子项目的优先级 (在第1章) 多对多维度(或多值维度)怎样表达?包括哪两类? 【参考答案:多对多维度需要增加一个桥接表来表示。它包括维度表和事实表之间的多对多、维度表与维度表之间的多对多两类。前者将桥接表与事实表相连,后者将其中的一个维度表与事实表相连。】(在第2章) 事实表分哪三类?有什么区别?(在第2章) 维度建模的主要步骤及每个步骤的主要成果(或检查点)(在第2章) 业务维度生命周期框图以及每个环节上微软(Microsoft)的可用工具集(在第3章) SQL SERVER 2005的三个版本及区别 (在第7章) 简要描述建立Analysis Services OLAP数据库的步骤(在第7章) OLAP数据库数据的物理存储有MOLAP等三种可选模式,试简述事实数据和维度数据可以采取的存储模式以及每种模式中数据的存放位置。这三种模式中哪种最节省存储空间?(在第7章) SQL SERVER 2005的主动缓存技术(在第7章) 数据挖掘【参考答案:从海量数据中提取有趣模式或知识(有趣是指:隐含的、非平凡的、事先未知的、潜在有用的)】 数据挖掘的两大类通用功能【参考答案:描述型数据挖掘和预测型数据挖掘。前者用于刻画数据集的一般特征,后者对现有数据进行推演以用于新实例(某个属性的取值)的预测。In general, data mining tasks can be classified into two categories: descriptive and predictive. Descriptive mining tasks characterize the general properties of the data in the database. Predictive mining tasks perform inference on the current data in order to make predictions.】 数据挖掘的3大主要支撑学科【参考答案:数据库技术、统计学、机器学习】 OLAM【参考答案:On-Line Analytical Mining,联机分析挖掘,将OLAP与数据挖掘相互融合进行数据探查分析,是未来基于数据仓库的数据分析的一种趋势】 OLAP的5种基本操作【参考答案:上卷、下钻、切片、切块、旋转】,了解每种操作什么意思 简单了解关联分析(又称为关联规则挖掘或购物篮分析)、分类、回归、聚类分析的功能

文档评论(0)

80092355km + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档