数据库基础与应用 第2版 王珊 李盛恩 第12章_第12章 数据仓库技术.pptVIP

  • 12
  • 0
  • 约 46页
  • 2015-12-10 发布于广东
  • 举报

数据库基础与应用 第2版 王珊 李盛恩 第12章_第12章 数据仓库技术.ppt

12.4 数据仓库系统的体系结构 为了将这些不一致的分散的数据集成起来,必须对它们进行转换后才能供分析之用。数据抽取、清洗、转换工具就是用来完成这些工作。 数据抽取工具主要通过网关或标准接口把原来OLTP系统中的数据按照数据仓库的数据组织进行抽取。 数据清洗主要是对源数据之间的不一致性进行专门处理,并且要去除与分析无关的数据或不利于分析处理的躁声数据。 12.4 数据仓库系统的体系结构 数据经过抽取、清洗和转换后,就可以装载到数据仓库中,这由数据仓库的装载工具来实现。 装载工具要解决的另一个问题是对大数据量的处理。数据仓库中的数据量比OLTP系统要大得多,进行装载需要很长的时间。目前通常的解决方式有两种:并行装载和增量装载。并行装载是把任务进行分解,充分利用CPU资源。增量装载就是只装载修改的元组以减少需要处理的数据量。 12.4 数据仓库系统的体系结构 数据仓库维护的主要内容是,周期性把操作型环境中的新数据定期加入(pump)数据仓库中、刷新数据仓库的当前细节数据、将过时的数据转化成历史数据,清除不再使用的数据,调整粒度级别等。 12.4 数据仓库系统的体系结构 元数据管理工具是数据仓库系统的

文档评论(0)

1亿VIP精品文档

相关文档