- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012春《数据仓库与数据挖掘》复习提纲
商务智能【参考:BI是一种解决方案,它的目的是把用户积累下来的、大量的数据
转化为业务容易理解的信息,进而辅助决策。】
Kimball对数据仓库的定义【参考:DW仅仅是构成它的数据集市的联合。】
Inmon对数据仓库的定义【参考:一个面向主题的、集成的、随时间变化的、非易
逝的用于支持管理的决策过程的数据集合。】
ETL【参考:数据的提取、转换和装载,预处理数据并装在DW中。】
数据仓库总线矩阵【参考:该矩阵将公司业务过程映射到参与这些过程的实体或对象。矩阵的每一行对应一个业务过程,每一列描述对象,它们参与了各种业务过程。】
事实【参考:对一些事件发生结果的度量。】
维度【参考:维度是维度模型的基础,用来描述业务的对象。】
粒度【参考:事实表中包含信息的详尽程度。】
维度模型【参考:由一个中心事实表(或者多个事实表)和与其相关的维度构成。事
实表位于中心,而所有维度表环绕在其周围,类似于星形结构,因此又把维度模型称为星形模式。】
业务过程维度模型【参考:关于一个业务过程所有的维度模型的集合。】
多维数据集(又称为数据立方体)由维度和一个或多个度量组构成的多维分析结构,用于OLAP
部署【参考:将多维数据集的定义发布到OLAP服务器上的过程。】
OLAP 联机分析处理采用多维数据结构和层次结构作为导航,探查汇总数据,辅助决策。
代理键【参考:对于DW/BI系统,需要在数据仓库数据库中建立一组与事务处理
源系统中的键分离开来的全新的键,称这种键为代理键。】独立于业务键的用于数据仓库中的从ETL中的人工键
渐变维度【参考:属性值可以改变的维度。分为值的改变需要跟踪和不需要跟踪两
种。】
聚合【参考:经过预先计算后形成的汇总表,主要目标是用来改进查询性能。】
星型模型【参考:由一个事实表和多个维度表构成的模型。事实表与维度表是1对多关系。事实表位于中心,而所有维度表环绕在其周围,类似于星形结构。】
雪花模型【参考:雪花模型是将维度表中的字段和查找表相连接而得到的结果。】
事实星座模型 由多个星型模型或雪花模型通过共享维度形成的多事实表多维度表的模型
多维数据库【参考:采用多维数据组存储数据,主要应用于OLAP服务器的数据存
储结构。】
SQL Server 2005的维度层次
SQL Server 2005的属性层次 SQL Server Analysis Service默认为每个维度每个属性构成的单层结构
数据挖掘【参考答案:从海量数据中提取有趣模式或知识(有趣是指:隐含的、非平凡的、事先未知的、潜在有用的)】
数据挖掘的两大类通用功能【参考答案:描述型数据挖掘和预测型数据挖掘。前者用于刻画数据集的一般特征,后者对现有数据进行推演以用于新实例(某个属性的取值)的预测。】
OLAM【参考答案:On-Line Analytical Mining,联机分析挖掘,将OLAP与数据挖掘相互融合进行数据探查分析,是未来基于数据仓库的数据分析的一种趋势】
简单了解关联分析(又称为关联规则挖掘或购物篮分析)、分类、回归、聚类分析的功能
关联分析:发现交易数据库中不同商品(项)之间的联系
分类:预测离散属性的取值
回归:预测连续属性的取值
聚类分析:将到不同的类或者簇Bill Inmon将数据仓库定义为“一个面向主题的、集成的、随时间变化的、非易逝的用于支持管理的决策过程的数据集合” 。Ralph Kimball说“数据仓库仅仅是构成它的数据集市的联合” 。(2)数据仓库构建方法之争:恩门的“Building the Data Warehouse”主张建立数据仓库时采用自上而下(DWDM)方式,以第3范式进行数据仓库模型设计,而他生活上的好朋友Ralph Kimball在“The DataWarehouse Toolkit”则是主张自下而上(DMDW)的方式,力推数据集市建设,以致他们的FANS吵闹得差点打了起来,直至恩门推出新的BI架构CIF(Corporation information factory),把Kimball的数据集市包括了进来才算平息。恩门认为星型模型只适用于数据集市(星型模型对于数据集市是十分理想的),而不适用于数据仓库。(3) 对数据集市的理解差异: Inmon:面向部门(Department)的小型数据仓库——BPR, Kimball:面向业务过程 (Process)的小型数据仓库 ——BPM。】
Kimball流派主张基于哪四个主要原则的迭代方法来构建数据仓库体系【参考:(1)
从业务着手——出发点;(2)构建一个信息基础设施——设计一个单一、集成、易用、高效的信息基础平台能够满足企业内部的各种需求;(3)按时间周期增量交付——根据业务价值进行优先级排序,每个时间周期对应时间轴上
您可能关注的文档
- (已修改)农业现代服务业-以工促农的产业路径.doc
- “法律不确定性”-内涵、渊源及其启示.doc
- “小学生英语学习现状分析及其对策”课题的研究报告.doc
- 《21世纪课堂评价》结业作业模板数学.doc
- 《红楼梦》中管理思想对现代管理的启示.doc
- 《土木工程概论.》思考题.doc
- 《现代中国的的政治建设、祖国统一和对外关系》综合测试题.doc
- 《氧气的性质与用途》说课稿.doc
- 70.辨阴阳易差后劳复病证并治、伤寒六经病证治总结.doc
- 00755《广告设计和创意》5月复习题.doc
- 养老评估师中级行为面试题库及案例分析.docx
- 面试培训督导时考察其课程理解能力的题目.docx
- 税务专员面试中关于增值税政策的常见问题解答.docx
- 2025宁波市医疗保障局局属事业单位宁波市医疗保障基金管理中心招聘事业编制工作人员1人备考试题附答案.docx
- 2025咸宁市汉口银行咸宁嘉鱼支行招聘笔试历年题库附答案解析.docx
- 2025北京人才发展战略研究院招录笔试备考题库附答案.docx
- 2025四川成都市龙泉驿区青台山中学校秋季教师招聘22人笔试试题附答案解析.docx
- 2025台州市银龄讲学计划教师招募13人笔试参考试题附答案解析.docx
- 2025中国铁建公开招聘42人笔试题库附答案.docx
- 2025中智咨询研究院社会招聘笔试参考题库附答案.docx
原创力文档


文档评论(0)