最新数据仓库和数据挖掘题库.docVIP

  • 5
  • 0
  • 约8.03千字
  • 约 11页
  • 2017-02-11 发布于江苏
  • 举报
一、填空题(2×10=20分) 1、数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。? 2、元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。 ?3、数据处理通常分成两大类:联机事务处理和联机分析处理。 4、ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。 5、调和数据是存储在企业级数据仓库和操作型数据存储中的数据。 6、数据抽取的两个常见类型是静态抽取和增量抽取。静态抽取用于最初填充数据仓库,增量抽取用于进行数据仓库的维护。 7、维度表一般由主键、分类层次和描述属性组成。对于主键可以选择两种方式:一种是采用自然键,另一种是采用代理键。? 7、雪花型模式是对星型模式维表的进一步层次化和规范化来消除冗余的数据。? 8、数据仓库中存在不同综合级别的数据。一般把数据分成4个级别:早期细节级、当前细节级、轻度综合级和高度综合级。? 9、数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成部分(包括名称、维度、类别、层次和度量)全面地描述出来。 10、确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据用户需求设计聚合模型。 11、粒度是对数据仓库中数据的综合程度高低的一个衡量。粒度越小,细节程

文档评论(0)

1亿VIP精品文档

相关文档