- 11
- 0
- 约1.03万字
- 约 29页
- 2022-03-20 发布于浙江
- 举报
?
?
数据仓库架构以及多维数据模型的设计
?
?
作者 |?云祁
封图| 下载于视觉中国
一、前言
作者最近看了《Hadoop构建数据仓库实践》这本书,收获很多,把一些关于数仓实践的心得整理出来,方便大家共同学习。
二、数据仓库的定义
数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用使用。
三、数据仓库的特点
面向主题的:数据仓库都是基于某个明确的主题,仅需要与该主题相关的数据,其他的无关细节将会被去掉。
集成的:数据仓库里面的数据都是经过ETL( Extract-Transform-Load 抽取-转换-加载)操作后被集中放到同一个数据源,数据仓库里的数据是来自于各种不同的数据源。
随时间变化的:关键数据隐式或者显示地随时间变化而变化。
数据相对稳定的:数据装入后一般只是进行查询操作,没有传统数据库的增删改操作。
总结:数据仓库就是整合多个数据源的历史数据进行细粒度的、多维的分析,可以有效地帮助高层管理者或者业务分析人员做出商业战略决策或商业报表。
四、数据仓库的作用
可以整合公司的所有业务,建立统一的数据中心。
分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果。
可以作为各个业务的数据源,形成业务数据
您可能关注的文档
- 收藏阿里P9耗时28天,总结历年亿级活动高并发系统设计手册.docx
- 敏捷模式下,测试用例的设计方法.docx
- 教育信息化背景高校公共课程形成性评价研究.docx
- 敦煌壁画舞蹈的科普设计研究.docx
- 数仓维度建模-之事实表维度表设计.docx
- 数仓维度建模之维度表设计.docx
- 数字IC设计工具教程-VCS(lab2-VCS-Debugging-Basics).docx
- 数字化生存-的经营关键词.docx
- 数字化转型:服务化设计原则.docx
- 数字图像处理特效中彩色墨水效果的设计与实现.docx
- 广西南宁市第二中学2025-2026学年八年级下学期开学收心自测英语试卷(含解析).docx
- 广西南宁市武鸣区武鸣高级中学等校2026年高考模拟信息卷数学试题(含解析).docx
- 广西壮族自治区崇左市江州区2025-2026学年八年级上学期期末语文试题(含解析).docx
- 广西壮族自治区防城港市防城区2025—2026学年八年级上学期期末地理试题(含解析).docx
- 部编版一年级下册语文第五单元培优卷A卷(含答案).docx
- 福建省厦门海沧实验中学2025-2026学年高二上学期期末地理试题(含解析).docx
- 甘肃省天水市甘谷县模范初级中学2025-2026学年九年级数学下学期第一次检测考试试题(含解析).docx
- 甘肃省武威市凉州区爱华育新学校2025-2026学年九年级上学期12月月考英语试题(解析版).docx
- 甘肃张掖市2025--2026学年下学期九年级数学阶段反馈试卷(含解析).docx
- 广东惠州博罗县2025-2026学年九年级上学期阶段诊断历史试卷(含解析).docx
原创力文档

文档评论(0)