- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章:数据仓库的基本概念 1-1 数据仓库的产生与发展传统的数据库技术作为数据管理手段,主要用于联机事务处理(OLTP,On-Line Transaction Process), 数据库中保存的是大量的日常业务数据。在数据共享、数据与应用程序的独立性、维护数据的一致性与完整性、数据的安全保密性等方面提供了有效的手段。与分析型应用结合时存在的问题: 决策支持系统为掌握充分的信息,需要访问大量的企业内部数据和外部数据。 传统数据库中的大量数据是事务型数据,即该数据是对每一项工作、管理对象的具体的、细节性的描述。 事务处理型应用与分析决策型应用对数据库系统的性能要求不同。 传统数据库中保存和管理的一般是当前数据,而决策支持系统不仅需要当前的数据,而且还要求有大量的历史数据。结论:在事务处理型应用环境中直接构建分析决策型应用是不可行的。于是:面向分析决策型应用而组织和存储数据的数据仓库技术应运而生。时间:20世纪80年代初人物:W.H.Inmon定义: 数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。A data warehouse is a subject-oriented,integrated, time-variant,and nonvolatile collection of data in support of management’s decision making process.数据仓库的四大特征:数据是面向主题的数据是集成的数据是具有时间特征的数据是相对稳定的数据仓库的其它特点:数据量非常大(10GB---1000GB)是数据库技术的一种新的应用使用人员较少 1-2 数据仓库与数据库操作型数据库分析型数据仓库 系统目的支持日常操作支持管理需求,获取信息 使用人员办事员、DBA、数据库专家 经理、管理人员、分析专家 数据内容当前数据历史数据、派生数据 数据特点细节的综合的或提炼的 数据组织面向应用面向主题 存取类型添加、修改、查询、删除 查询、聚集 数据稳定性 动态的相对稳定续上表:操作型数据库 分析型数据仓库 需求特点需求事先可知道需求事先不知道 操作特点一个时刻操作一单元 一个时刻操作一集合 数据库设计基于E-R图基于星型模式、雪花模式 一次操作数据量 一次操作数据量小一次操作数据量大 存取频率较高较低 响应时间小于3秒几秒—几十分钟1-3 数据仓库技术的术语主题: (Subject)主题是一个在较高层次上将数据归类的标准,每一个主题基本对应一个宏观的分析领域。例:面向主题:产品订货分析,货物发运分析, 新产品开发分析;面向应用:财务,销售,供应,人力资源,生产调度……. 主题域的特征:独立性,完备性 粒度:(Granularity)粒度是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度越小,级别越低,回答查询的种类就越多。(数据堆积,回答综合问题效率低)数据越综合,粒度越大,级别越高,回答查询的种类就越少。维度:(Dimension)维度是指人们观察事物的角度。例如:当人们关注产品销售情况时,有如下维度:时间维:随时间变化的销售数据;地区维:不同地区的销售数据;客户维:不同客户的销售;……根据观察事物角度的细节程度不同,维又具有维层次。数据;渠道维:不同销售渠道的销售数据;产品维:不同产品的销售数据例:时间维:日期、周、月份、季度、年等;地区维:城市、地区、国家等。 前端工具 数 据 预 处理工具技术体系结构图如下:第一章 数据仓库的基本概念 预 处 理 数 据 数 据 源 数据集市 数据集市 数据集市 总 线 查询 服务 数据 元数据 OLAP 数据挖掘 其他工具 报表生成器 抽取、转换、装载 可视化 分 析 结 果 后台 前台 潭绚蔚岔陕缝迭纫件绝夯傈摈桑颖木脓巫焕轩媚赶宜哄褐搂覆咽旭梆匹蕴数据仓库与数据挖掘课件ppt数据仓库与数据挖掘课件ppt 第一章 数据仓库的基本概念1-5-2 相关的数据存储数据源:数据源是数据仓库的原始来源,是数据仓库系统开发与应用的数据基础,分为两部分; 企业内部数据源 企业外部数据源 洋骇福果飞馏谗簇树慰淌陈箍紊禁舅妈数反姆叫与嘻爵腿份毁推霄氧红傻数据仓库与数据挖掘课件ppt数据仓库与数据挖掘课件ppt 第一章 数据仓库的基本概念主题数据:主题数据是数据仓库的核心数据,一般以多维数据模型的形式存储在数据仓库中,直接面向分析型用户的访问。主题数据的存储称为实视图,它与数据库的视图概念不同之处在于:它不是虚拟的,而是已经过计算,含有大量数据,并存储在数据仓库中的实实在在的表。 颤两涵克姥状沤呛阵琐五娥肮坊聚仔亦完脓少版归扔淹颊漳翠晾凶弧斋酬数
您可能关注的文档
最近下载
- 检验科职业安全防护和职业暴露紧急处理.ppt VIP
- 有机肥料检测报告.docx VIP
- 专题19.5 一次函数的应用【八大题型】(举一反三)(人教版)(解析版).pdf VIP
- (高清版)DG∕TJ 08-2075-2022 管线定向钻进技术标准.docx VIP
- 12J12 河北省12系列建筑标准设计图集 无障碍设施.docx VIP
- 两管理两综合一保护竞赛考试题库-外汇资本项目 .pdf VIP
- 八年级上册数学:专题24 二次根式【八大题型】(举一反三)(北师大版)(解析版).pdf VIP
- 2025年中国四氯化锆项目投资计划书.docx
- 液化石油气钢瓶智能制造项目可行性研究报告模板-备案拿地.doc
- 山西省建筑标准设计图集12J12 12系列建筑标准设计图集 无障碍设施.pdf VIP
文档评论(0)