- 3
- 0
- 约8.09千字
- 约 45页
- 2016-12-06 发布于广东
- 举报
第12章第12章数据仓库技术.ppt
12.4 数据仓库系统的体系结构 由于数据仓库的数据来源于多种不同的数据源。它们可能是不同平台上异构数据库中的数据,也可能是外部独立的数据文件、Web页面、市场调查报告等等。 因此,这些数据常常是不一致的。例如: (1)同一字段在不同应用中具有不同数据类型; (2)同一字段在不同应用中具有不同的名字; (3)同名字段,不同含义。 12.4 数据仓库系统的体系结构 为了将这些不一致的分散的数据集成起来,必须对它们进行转换后才能供分析之用。数据抽取、清洗、转换工具就是用来完成这些工作。 数据抽取工具主要通过网关或标准接口把原来OLTP系统中的数据按照数据仓库的数据组织进行抽取。 数据清洗主要是对源数据之间的不一致性进行专门处理,并且要去除与分析无关的数据或不利于分析处理的躁声数据。 12.4 数据仓库系统的体系结构 数据经过抽取、清洗和转换后,就可以装载到数据仓库中,这由数据仓库的装载工具来实现。 装载工具要解决的另一个问题是对大数据量的处理。数据仓库中的数据量比OLTP系统要大得多,进行装载需要很长的时间。目前通常的解决方式有两种:并行装载和增量装载。并行装载是把任务进行分解,充分利用CPU资源。增量装载就是只装载修改的
您可能关注的文档
最近下载
- 江苏中考历史历年真题含答案 (32) .pdf VIP
- 2023-2025历年高考英语必备高频词汇800词精选(真题版).docx
- 18医疗器械售后服务管理制度.docx VIP
- 全国青少年机器人技术等级考试(三级)试题.doc VIP
- 10 荀径-列控中心基本原理和功能.ppt
- 湖南省三湘名校教育联盟2024-2025学年高一下学期期中考试 英语试卷含答案.docx VIP
- 2026年江西省景德镇市地理生物会考真题试卷+答案.docx VIP
- 机器人等级考试(三级)模拟题.pdf
- GB 50058-2014 爆炸危险环境电力装置设计规范.docx VIP
- 2026年江西省景德镇市初二地理生物会考考试题库(附含答案).docx VIP
原创力文档

文档评论(0)