- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BI技术讲解介绍.ppt
BI技术介绍
郭春选2010-3-31
2
目 录
数据仓库
OLAP
ETL与数据质量
3
什么是数据仓库
“数据仓库是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策过程.”—W. H. Inmon
数据仓库的数据是面向主题:典型的主题领域:客户;产品;交易;帐目
数据仓库的数据是集成的:异构数据、数据提取、净化、转换、装载、编码统一
数据仓库的数据是不可更新的:数据仓库的数据通常是一起载入和访问的,但并不进行一般意义上的数据更新
数据仓库的数据是随时间不断变化的:
数据仓库中的时间期限要远远长于操作型系统中的时间期限(5~10年);
数据仓库中的数据是一系列某一时刻生成的复杂的快照;
数据仓库的键码结构总是包含某时间元素。
4
为什么要建独立数据仓库
术业有专攻,各类系统分工不同
DBMS(DataBase Managment System )是为OLTP(On-Line Transaction Processing )而设计的:存储方式,索引, 并发控制, 恢复,目前在电信中,DBMS主要负责业务支撑。
数据仓库是为OLAP(On-Line Analysis Processing )而设计:复杂的 OLAP查询, 多维视图,汇总,电信企业有海量的历史数据,需要总结历史经验,为企业更好的服务。
数据来源、应用与处理方式不同
历史数据: 决策支持需要历史数据,而这些数据在操作数据库中一般不会去维护
数据汇总:决策支持需要将来自异种源的数据统一(如聚集和汇总)
数据质量: 不同的源使用不一致的数据表示、编码和格式,对这些数据进行有效的分析需要将他们转化后进行集成
我的E家ARPU真的这么高?小X,确认一下!
是啊,真这么高?请支撑中心提数据分析下……
CRM系统提供E家档案……
计费系统提供E家收入……
财务部提供E家成本……
CRM和计费的E家档案有差异!以哪个为准?
南京不分档,南通分档,全省分还是不分?
财务不知道哪些成本是E家的…………
5
数据孤岛
口径不一致
数据驱动
数据仓库
统计中心
通过数据仓库的建设把不同系统中的口径统一化,通过 KPI、OLAP、固定报表等一系列基础统计应用建设,有效解决了数据分裂和口径的问题,为决策层提供数据支撑。
为什么要建独立数据仓库
6
一些关键知识点
ETL:
ETL(Extract/Transformation/Load)—用户从数据源抽取出所需的数据,经过数据清洗、转换,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
粒度
是指数据仓库的数据单位中保存数据细化或综合程度的级别,粒度问题是数据仓库的一个最重要概念。粒度的具体划分将直接影响到数据仓库中的数据量以及查询质量。数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。
元数据
关于数据的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。
分割
指将数据分散到各自的物理单元中去以便能分别独立处理,以提高数据处理效率。分割后的数据单元称为分片(区)。任何给定的数据单元属于且仅属于一个分割。
7
数据仓库的数据粒度结构
数据仓库的数据级别(粒度)
早期细节数据:存储过去的详细数据,反映真实的历史情况,这类数据随着时间增加,数据量很大,使用频率低,一般存储在转换介质中。(例如磁带中)
当前细节数据:存储最近时期的业务数据,反映当前业务的情况,数据量大,是数据仓库用户最感兴趣的部分。随着时间的推移,当前细节数据由数据仓库的时间控制机制转为早期细节数据。
轻度综合数据:从当前基本数据中提取出来,通常以较小的时间段(粒度)统计而成的数据,其数据量较细节及数据少得多。
高度综合数据:这一层的数据十分精炼,是一种准决策数据。
10
BI系统数据仓库架构图
示例
企业数据仓库体系
11
目 录
数据仓库
OLAP
ETL与数据质量
12
分 析 技 术 简 介
KPI
多维分析
固定报表
MR(营销再造)
13
分析方法运用范围
统计分析给你先机
数据
挖掘给
你洞察力
分析报告给你后见之明
14
什么是OLAP
OLAP:On-Line Analytical Processing(联机分析处理)
OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,也可以说是多维数据分析工具的集合。
OLAP
按照存储方式
MOLAP
HOLAP
ROLAP
Server OLAP
按照处理地点
Client OLAP
15
什么是ROLAP、MOLAP、HOLAP?
ROLAP :将分析用的多维数据存储在关系数据库中并根据应用的需要有选择的定义一
您可能关注的文档
- 4月份医疗护理事项说明查房.ppt
- 4月全院性医疗护理事项说明查房.ppt
- 4疼痛及其医疗护理事项说明.ppt
- 4老年医疗护理事项说明心理健康.ppt
- 4高血压医疗护理事项说明.ppt
- 5-1第九章节中暑、淹溺和触电.ppt
- 5月 新增医疗护理事项说明制度学习及掌握.ppt
- 5月麻疹医疗护理事项说明查房.ppt
- 5生活医疗护理事项说明.ppt
- 6-舒适医疗护理事项说明.ppt
- 《“书证融通”模式在职业院校学生职业规划指导中的应用探索》教学研究课题报告.docx
- 小学历史教学中的历史事件解读与历史文献分析探究教学研究课题报告.docx
- 小学语文阅读教学策略与效果评估报告教学研究课题报告.docx
- 小学美术教育中数字绘画软件的创意教学研究教学研究课题报告.docx
- 《基于大数据分析的农村初中英语教学资源整合策略研究》教学研究课题报告.docx
- 网易游戏游戏开发工程师与游戏测试面试题 .pdf
- 节能减排视角下化工企业绿色制造技术集成创新研究综述教学研究课题报告.docx
- 高中语文作文教学的有效性研究——以《我的妈妈》为例教学研究课题报告.docx
- 2025年江苏省公务员考试时事政治考试试卷带解析含完整答案【夺冠系列】.docx
- 网络优化典型案例分析 .pdf
最近下载
- 淘宝买菜业务题库.docx VIP
- 欧洲的工工业化与劳工运动的兴起.pptx
- Testing for competence rather than for “intelligence:(测试的能力,而不是u201C情报).pdf
- 《集中用餐单位落实食品安全主体责任监督管理规定》解读与培训.pptx VIP
- ML梅花形弹性联轴器选型参数表.pdf VIP
- 黄原胶发酵工厂设计.doc VIP
- 年产1000吨黄原胶发酵工厂的设计.docx VIP
- TCITS 181-2024 基于黑黄红色彩学的中国女性面部肤色定量测试与评价方法.docx VIP
- 儿童心理问题的早期干预与疏导.pptx VIP
- 力劲冷室压铸机液压原理分析.doc
文档评论(0)