- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘试题》
判断题(每小题1分,计30分,答题时每5个答案写在一起)
数据库作为数据资源用于管理业务中的信息分析处理。(X)
数据库的查询不是指对记录级数据的查询,而是指对分析要求的查询。(X)
关系数据库是二维数据(平面),多维数据库是空间立体数据。(v)
数据进入数据仓库之前,必须经过加工与集成。(V)
OLAP使用的是当前数据;OLTP使用的是历史数据。(V)
对数据仓库操作不明确,操作数据量少。(X)
数据集市实现难度超过数据仓库。(X)
OLAP使用的数据经常更新;OLTP使用的数据不更新,但周期性刷新。(X)
数据集市可升级到完整的数据仓库。(V)
数据库中存放的数据基本上是保存当前综合数据。(X)
OLAP可以应分析人员的要求快速、灵活地进行大数据量的复杂处理。(V)
OLAP支持复杂的决策分析操作,侧重对分析人员和高层管理人员的决策支持。(V)
OLTP的事务处理量大,处理内容比较简单但重复率高。(V)
数据仓库的用户有两类:信息使用者和探索者。(V)
对数据库的操作比较明确,操作数据量大。(X)
数据库用于事务处理,数据仓库用于决策分析。(V)
信息使用者以一种可预测的、重发性的方式使用数据仓库平台。(V)
OLAP一次处理的数据量大;OLTP一次性处理的数据量小。(V)
OLTP每次操作的数据量不大且多为当前的数据。(V )
数据仓库系统由数据仓库(DW)、仓库管理和分析工具三部分组成。(V)
随着业务的变化,数据仓库中的数据会随时更新。(X)
数据集市的规模比数据仓库更大。(X)
数据集市具有更详细的、预先存储在数据仓库的数据。(V)
不同维值的组合及其对应的度量值构成了不同的查询和分析。(V)
OLAP使用细节性数据,OLTP使用综合性数据。(X)
数据集市由企业管理和维护。(X)
OLAP的概念模型是多维的。(V)
数据库已经成为了成熟的信息基础设施。(V)
数据库既保存过去的数据又保存当前的数据。(X)
OLTP面对的是事务处理操作人员和低层管理人员。(V)
填空题(每小题1分,计10分)
信息使用者通常查看 概括数据聚集计算多维数据分析
Data Marts是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。
4,元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。
2,数据挖掘(DM) :KDD
法从数据中抽取知识。
5,知识发现(KDD):从数据中发现有用知识的整个过程。
6,数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。
在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。
比较统计学与数据挖掘的异同?
统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。
数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。
统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。
比较OLAP的数据模型MOLAP与ROLAP?
MOLAP是事先生成多维立方体,供以后查询分析用,而ROLAP是通过动态的生成Sql,去做查询关系型数据库,如果没有做性能优化,数据量很大的时候,性能问题就会显得比较突出了。
ROLAP与MOLAP比较
ROLAP MOLAP 沿用现有的关系数据库的技术 专为OLAP所设计 响应速度比MOLAP慢;
现有关系型数据库已经对OLAP做了很多优化,包括并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL的OLAP扩展(cube,rollup)等,性能有所提高 性能好、响应速度快 数据装载速度快 数据装载速度慢 存储空间耗费小,维数没有限制 需要进行预计算,可能导致数据爆炸,维数有限;无法支持维的动态变化 ? ? 借用RDBMS存储数据,没有文件大小限制 受操作系统平台中文件大小的限制,难以达到TB级(只能10~20G) 可以通过SQL实现详细数据与概要数据的存储 缺乏数据模型和数据访问的标准 –不支持有关预计算的读写操作
–SQL无法完成部分计算
?无法完成多行的计算
?无法完成维之间的计算 –支持高性能的决策支持计算
?复杂的跨维计算
?多用户的读写操作
?行级的计算 维护困难 管理简便 OLAP的典型
您可能关注的文档
最近下载
- (施工组织设计汇总)施工组织设计编制说明、工程概况、施工准备.doc VIP
- 陕西省高速公路施工标准化指南 施工标准化(第二册).pdf VIP
- 生长发育与儿童保健.pptx VIP
- 2025年中考数学---《一元二次方程之实际应用》知识点总结与专项练习题精品.pdf VIP
- 设计师在非正式合作城市开发项目中的参与及角色分析——重庆黄水镇地产项目为例.pdf VIP
- 小学生吸尘器课件.pptx VIP
- (新人教版)八年级英语上册Unit 1大单元教学设计.docx
- 刍议基于建筑外墙防渗漏技术的施工.pdf VIP
- 大学语文——特洛伊_赫克托耳之死.ppt VIP
- 儿童保健:儿童生长发育规律.pptx VIP
文档评论(0)