- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《1.DW数据仓库
10.4 数据库的发展 10.4.1 数据仓库 存在两种不同的数据处理工作,操作型处理和分析型处理,也称作OLTP(联机事务处理)和OLAP(联机分析处理)。 操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,如火车售票系统、银行通存通兑系统和税务征收管理系统等。这些系统要求快速响应用户请求,对数据的安全性、完整性以及事务吞吐量要求很高。 分析型处理是指对数据的查询和分析操作。通常是对海量的历史的数据查询和分析,如金融风险预测预警系统和证券股市违规分析系统等。这些系统要访问的数据量非常大,查询和分析的操作十分复杂。 两者之间的差异使得传统的数据库技术不能同时满足这两类数据处理的要求,数据仓库技术应运而生。 1. 什么是数据仓库 数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织技术。 2. 数据仓库的特征 数据仓库和数据库主要的区别是数据仓库中的数据具有以下四个基本特征: (1)数据仓库的数据是面向主题的; (2)数据仓库的数据是集成的; (3)数据仓库的数据是不可更新的; (4)数据仓库的数据是随时间不断变化的。 一、主题与面向主题 与传统数据库面向应用进行数据 组织的特点相对应,数据仓库中的数据是面向主题进行组织的。 什么是主题呢?从逻辑意义上讲,主题是企业中某一宏观分析领域所涉及的分析对象。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据进行综合、归类并分析利用。所谓较高层次是相对面向应用的数据组织方式而言的,是按照主题进行数据组织的方式具有更高的数据抽象级别。 为了更好地理解主题与面向主题的概念,说明面向主题的数据组织与传统的面向应用的数据组织方式的不同,我们用一个例子来详细说明。 一家采用“会员制”经营方式的商场,按业务已建立起销售、采购、库存管理以及人事管理等子系统。按照其业务处理要求,建立了各子系统的数据库模式: 采购子系统: 订 单 (订单号,供应商号,总金额,日期) 订单细则 (订单号,商品号,类别,单价,数量) 供应商 (供应商号,供应商名,地址,电话) 销售子系统: 顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话) 销售(员工号,顾客号,商品号,数量,单价,日期) 库存管理子系统: 领料单(领料单号,领料人,商品号,数量,日期) 进料单(进料单号,订单号,进料人,收料人,日期) 库存(商品号,库房号,库存量,日期) 库房(库房号,仓库管理员,地点,库存商品描述) 人事管理子系统: 员工(员工号,姓名,性别,年龄,文化程度,部门号) 部门(部门号,部门名称,部门主管,电话) 按照面向主题的方式,应该分两个步骤来组织数据: 抽取主题 确定每个主题所应包含的数据内容。 概括各种分析对象,我们抽取了商场的供应商、商品、顾客三个主题。 然后确定每个主题所应包含的数据内容这三个主题包含的主要内容有: 商品: 商品固有信息: 商品号,商品名,类别和颜色等。 商品采购信息: 商品号,供应商号,供应价,供应日期和供应量等。 商品销售信息: 商品号,顾客号,售价,销售日期和销售量等。 商品库存信息: 商品号,库房号,库存量和日期等。 供应商: 供应商固有信息: 供应商号,供应商名,地址和电话等。 供应商品信息: 供应商号,商品号,供应价,供应日期和供应量等。 顾客 顾客固有信息: 顾客号,顾客名,性别,年龄,文化程度,住址和电话等。 顾客购物信息: 顾客号,商品号,售价,购买日期和购买量等。 比照商场原有数据库的数据模式,我们可以看到: 首先,在从面向应用到面向主题的转变过程中,丢弃了与分析活动关系不大的信息,如订单、领料单等。 其次,在原有数据库模式中,关于商品的信息分散在各子系统中,如商品的采购信息存在采购子系统中,商品的销售信息则存在销售子系统中,商品库存信息却又在库存管理子系统中管理,没有形成有关商品的完整一致的描述。 面向主题的数据组织方式所强调的就是要形成关于商品的一致的信息集合,以便在此基础上针对“商品”这一分析对象进行分析处理。 二、数据仓库的数据是集成的 数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是对这些数据(还可以包含外部数据)经过了加工、汇总和整理,是一致的、良构的、高质量的数据。 三、数据仓库的数据是不可更新的 OLTP数据库中的数据经过抽取(Extractin
您可能关注的文档
最近下载
- 湖北省武汉市十一初级中学2024-2025学年七年级上学期10月月考英语试卷(含答案,无听力音频听力原文).pdf VIP
- T_ZJATA 0033-2025 塑胶玩具中双酚类和烷基酚类物质迁移量的测定 液相色谱-串联质谱法.docx VIP
- 《“探界者”钟扬》精品教案精品教案.doc VIP
- 知识点汇总_古代汉语.pdf VIP
- 活动执行质量保障措施方案.pdf VIP
- 2024年新课标人教版小学体育水平三全册教案.docx
- 2025年注册安全工程师《法律法规》30个必考点终极预测与高仿真模拟题库.pdf
- 2024-2025学年初中数学六年级上册(2024)鲁教版(五四学制)(2024)教学设计合集.docx
- T_ZJATA 0033-2025 塑胶玩具中双酚类和烷基酚类物质迁移量的测定 液相色谱-串联质谱法.pdf VIP
- T_ZBXH 141-2025 甜菜旋幽夜蛾防控技术规程.pdf VIP
文档评论(0)