- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库1-数据仓库概述
第1讲 数据仓库概述;数据仓库概述;数据仓库概述;1.1数据仓库产生的原因;1.1数据仓库产生的原因;1.1数据仓库产生的原因;1.1数据仓库产生的原因;1.1数据仓库产生的原因;1.1数据仓库产生的原因;1.1数据仓库产生的原因;1.1.1操作型数据处理;1.1.1操作型数据处理;1.1.1操作型数据处理;1.1.2分析型数据处理;1.1.2分析型数据处理;1.1.2分析型数据处理;;1.1.4数据库系统的局限;1.1.4数据库系统的局限;1.1.4数据库系统的局限;1.1.4数据库系统的局限(续);2)“蜘蛛网”问题
解决数据分散的一种方法就是对数据进行集成
抽取程序带来了“蜘蛛网”问题,即需要在抽取的数据中再次抽取,将导致企业数据之间形成错综复杂的网状结构。;3)数据不一致问题
由于数据分散,导致多个应用间的数据不一致:
同一字段在不同应用中具有不同的数据类型
同一字段在不同应用中具有不同的名字
字段名字相同,但含义不同;4)数据动态集成问题
数据集成开销很大。一些应用仅在开始时对进行集成,以后一直以这部分集成数据作为分析基础,称为静态集成。导致决策者使用过时数据。
如果希望能够用上最新数据,每次分析之前都进行数据集成,称为动态集成。联机事务处理系统不具备动态集成能力。;5)历史数据问题
联机事务处理一般只需要当前数据,数据库适于存储高度结构化的日常事务细节数据。
决策型数据多为历史性、汇总性或计算性数据。
;6)数据的综合问题
联机事务处理系统中积累了大量的细节数据,决策支持系统并不对细节数据进行分析。
决策分析环境中,细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者的注意力。
因此分析前,需要对细节数据进行不同程度的综合。;结论
要提高分析和决策的效率和有效性,必须把分析数据从事务处理环境中提取出来,按照决策支持系统处理的需要进行重新组织,建立单独的分析型处理环境。
数据仓库正是为了构建这种新的分析型处理环境而出现的一种数据存储和组织技术。;数据仓库概述; “数据仓库”一词最早是在1990年,由Bill Inmon提出的。
数据仓库的四个基本特征:
数据仓库的数据是面向主题的(Subject Oriented);
数据仓库的数据时集成的(Integrate);
数据仓库的数据不可更新(Non-Volatile);
数据仓库的数据时随时间不断变化(Time Variant)的。 ;数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,通常用于企业的决策支持。 ;主题:是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑上,它对应于企业中某一宏观分析领域所涉及的分析对象。
面向主题的数据组织方式可在较高层次上对分析对象的数据给出完整、一致的描述。;传统的面向应用的数据组织方式
围绕相关的组织、部门进行详细调查,收集数据库的基础数据及其处理过程。
掌握企业内数据的动态特征(数据流图)。
面向主题的数据组织方式
抽取主题
确定每个主题所应包含的数据内容;采购子系统:
订单(订单号,供应商号,总金额,日期)
订单细则(订单号,商品号,类别,单价,数量)
供应商(供应商号,供应商名,地址,电话)
销售子系统:
顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话)
销售(员工号,顾客号,商品号,数量,单价,日期);人事管理子系统:
员工(员工号,姓名,性别,年龄,文化程度,部门号)
部门(部门号,部门名称,部门主管,电话)
库存管理子系统:
领料单(领料单号,领料人,商品号,数量,日期)
进料单(进料单号,订单号,进料人,收料人,日期)
库存(商品号,库房号,库存量,日期)
库房(库房号,仓库管理员,地点,库存商品描述);传统的面向应用进行数据组织方式的特征为:
重点在“数据”和“处理”;
所生成的各项数据库模式与企业实际的业务处理流程中所涉及的单据及文档,有很好的对应关系;
并没有真正体现数据与数据处理的分离。;面向应用到面向主题的转变:
面向主题的数据组织方式应分为两个步骤:
?抽取主题
?确定每个主题所包含的数据内容
仍以商场为例,它所应有的主题包括:商品、供应商、顾客。每个主题有各自独立的逻辑内涵,对应一个分析对象。;商品:
商品固有信息:商品号,商品名,类别,颜色等
商品采购信息:商品号,供应商号,供应价,供应日期,供应量等
商品销售信息:商品号,顾客号,售价,销售日期,销售量等
商品库存信息:商品号,库房号,库存量,日期等;供应商:
供应商固有信息:供应商号,供应商名,地址,电话等。
供应商品信息:供应商号,供应价,供应日期,供应量等。
顾客:
顾客固有信息:顾客号,顾客名,性别,年龄,文化程度,住址
顾客购物信息:
您可能关注的文档
- AIX性能优化操作教程.ppt
- AI--_快捷键教程.docx
- AI_机器学习教程.pptx
- AI第四章文本的编辑教程.pptx
- AI自学—入门知识大全教程.doc
- AJAX请求数据_demo教程.doc
- Ajax程序设计教程.ppt
- 揭秘化妆品小技巧及其使用方法.pptx
- AI第一章初识IllustratorCS6教程.pptx
- ALD应用教程.pptx
- PDM软件:Siemens Teamcenter二次开发_(17).Teamcenter最佳实践与案例分析.docx
- SCADA软件:GE Proficy二次开发_(4).Proficy开发环境搭建.docx
- 智能电表软件:Landis+Gyr智能电表二次开发_(13).系统集成与测试.docx
- 智能电表软件:Elster智能电表二次开发_(8).Elster智能电表二次开发环境搭建.docx
- PDM软件:Siemens Teamcenter二次开发_(11).TeamcenterAPI与编程基础.docx
- SCADA软件:GE Proficy二次开发_(7).报警与事件管理.docx
- 智能电表软件:Echelon智能电表二次开发_(11).智能电表行业标准与法规.docx
- 智能电表软件:Itron智能电表二次开发_(6).用户界面定制与开发.docx
- 智能电表软件:Elster智能电表二次开发_(9).Elster智能电表二次开发工具使用.docx
- PDM软件:PTC Windchill二次开发_(21).Windchill最佳实践案例分析.docx
文档评论(0)