大数据仓库与大数据挖掘习题问题详解.pdfVIP

大数据仓库与大数据挖掘习题问题详解.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

word

数据仓库与数据挖掘习题答案

第1章数据仓库的概念与体系结构

1.面向主题的,相对稳定的。2.技术元数据,业务元数据。3.联机分析处理OLAP。

4.切片〔Slice〕,钻取〔Drill-down和Roll-up等〕。5.基于关系数据库。

6.数据抽取,数据存储与管理。

7.两层架构,独立型数据集市,依赖型数据集市和操作型数据存储,逻辑型数据集市和实

时数据仓库。

8.可更新的,当前值的。9.接近实时。

10.以报表为主,以分析为主,以预测模型为主,以营运导向为主。11.答:数据仓库

就是一个面向主题的〔SubjectOriented〕、集成的〔Integrate〕、相对稳定的〔Non-Volatile〕、

反映历史变化〔TimeVariant〕的数据集合,通常用于辅助决策支持。数据仓库的特点包

含以下几个方面:〔1〕面向主题。操作型数据库的数据组织是面向事务处理任务,各个

业务系统之间各自别离;而数据仓库中的数据是按照一定的主题域进展组织。主题是一个抽

象的概念,是指用户使用数据仓库进展决策时所关心的重点领域,一个主题通常与多个操作

型业务系统或外部档案数据相关。〔2〕集成的。面向事务处理的操作型数据库通常与某

些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对

原有分散的数据库数据作抽取、清理的根底上经过系统加工、汇总和整理得到的,必须消除

1/8

word

源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息。也

就是说存放在数据仓库中的数据应使用一致的命名规如此、格式、编码结构和相关特性来定

义。〔3〕相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要与时发生变

化。数据仓库的数据主要供单位决策分析之用,对所涉与的数据操作主要是数据查询和加载,

一旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改

和删除操作,也就是说针对数据仓库,通常有大量的查询操作与少量定期的加载〔或刷新〕

操作。〔4〕反映历史变化。操作型数据库〔OLTP〕主要关心当前某一个时间段内的数据,

而数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究

趋势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开始启用数据仓库系统

的时点)到目前的所有时期的信息,通过这些信息,可以对单位的开展历程和未来趋势做出

定量分析和预测。12.答:〔1〕两层架构〔GenericTwo-LevelArchitecture〕。〔2〕独

立型数据集市〔IndependentDataMart〕。〔3〕依赖型数据集市和操作型数据存储〔Dependent

DataMartandOperationalDataStore〕。〔4〕逻辑型数据集市和实时数据仓库〔LogicalData

MartandReal-TimeDataWarehouse〕。

13.答:数据仓库技术的开展包括数据抽取、存储管理、数据表现和方法论等方面。在数

据抽取方面,未来的技术开展将集中在系统集成化方面。它将互连、转换、复制、调度、监

控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和

维护。在数据管理方面,未来的开展将使数据库厂商明确推出数据仓库引擎,作为数据仓库

服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将

最具开展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并

与Internet/Web技术严密结合。按行业应用特征细化的数据仓库用户前端软件将成为产品作

为数据仓库解决方案的一局部。数据仓库实现过程的方法论将更加普与,将成为数据库设计

的一个明确分支,成为管理信息系统设计的必备。

14.答:〔1〕IBM公司提供了一套基于可视化数据仓库的商业智能〔BI〕解决方案,包

括:VisualWarehouse〔VW〕、Essbase/DB2OLAPSer

文档评论(0)

xinhezil + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体衢州市衢江区星赫电子商务商行
IP属地浙江
统一社会信用代码/组织机构代码
92330803MA7BB9H7X8

1亿VIP精品文档

相关文档