新编计算机导论 教学课件 作者 张丽娜 周苏 王文 金海溶 第12章 数据库、数据仓库与数据挖掘.pptVIP

  • 2
  • 0
  • 约1.34万字
  • 约 83页
  • 2019-10-08 发布于广东
  • 举报

新编计算机导论 教学课件 作者 张丽娜 周苏 王文 金海溶 第12章 数据库、数据仓库与数据挖掘.ppt

12.4.2 数据仓库的组成 数据仓库由数据仓库数据库、数据抽取工具、元数据等内容组成。 1) 数据仓库数据库。这是整个数据仓库环境的核心,是数据存放的地方,提供对数据检索的支持。相对于操纵型数据库来说,其突出特点是对海量数据的支持和快速的检索技术。 2) 数据抽取工具。把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,以访问不同的数据。数据转换包括删除对决策应用没有意义的数据段;转换到统一的数据名称和定义;计算统计和衍生数据;给缺值数据赋以缺省值;把不同的数据定义方式统一等。 12.4.2 数据仓库的组成 3) 元数据。是指描述数据仓库内数据的结构和建立方法的数据。可将其按用途不同分为两类,即技术元数据和商业元数据。 技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。包括数据源信息、数据转换的描述、数据仓库内对象和数据结构的定义、数据清理和数据更新的规则、源数据到目的数据的映射、用户访问权限、数据备份历史记录、数据导入历史记录、信息发布历史记录等。 商业元数据从商业业务的角度描述了数据仓库中的数据。包括业务主题的描述、包含的数据、查询、报表等。 12.4.2 数据仓库的组成 元数据为访问数据仓库提供了一个信息目录,这个目录全面描述了数据仓库中有什么数据、这些数据是怎么得

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档