- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
企业数据仓库技术应用探析
企业数据仓库技术应用探析内容摘要:本文介绍了数据仓库在现代企业中所起的作用和地位,分析了数据仓库系统的设计策略,在此基础上,提出了数据仓库应用中所要面对的安全问题。
关键词:数据仓库 设计策略 数据安全
数据仓库是数据库技术的发展和延伸,是在一个全新层面上的数据库应用系统。数据仓库系统与传统的数据库应用系统最大的区别在于它向用户最终展示的不是企业过去已经具有的信息。它能够将分布在企业网络中的各种数据集中起来,为决策者提供各种有效的数据分析,从而起到决策支持的作用。美国Inmon在《Building the Date Warehouse》一书中对数据仓库作了如下定义:“数据仓库是一个面向主题的、集成的、稳定的、随时间不断变化的数据集合,它用于支持管理中的决策制定过程”。
数据仓库在现代企业中的重要作用和地位
现在企业中数据仓库的应用主要有以下几个方面:决策支持。这是建立数据仓库最为重要的应用。数据仓库通过对繁多的实时数据和历史数据进行综合、提炼将决策支持所需要的信息从企业的日常运行数据之中分离出来向企业中的决策者提供他们所关心的企业运行的某一特定侧面的信息;历史趋势分析。数据仓库中保留着大量的历史数据,可以用来进行历史趋势分析,为进一步的生产提供指导作用;数据挖掘。采用人工智能、统计学等技术实现自动化地分析企业的历史数据,做出归纳性的推理,可以预测企业未来的发展方向,帮助企业的决策者及时调整策略、减少风险,做出正确的决策。数据挖掘技术能帮助用户从数量非常庞大的数据海洋中提取出高质量信息,这是数据仓库的一个非常重要的作用;生产调度。数据仓库能够从企业中各部门的复杂的数据库中进行综合提取和集成,保证了全局数据的一致性,从根本上避免了决策中面对不同部门的矛盾数据复杂的处理过程,保证了企业调度的效率和正确性。
数据仓库在企业管理中重要性正被越来越多的企业所认可。已广泛应用于证券、金融、税务、保险等行业中。Meta Gyoup咨询公司曾预测,在世纪之交,全球将建立2000万套以上的数据仓库。数据仓库和数据挖掘技术将是企业、银行、政府等领域提高自己效益和效率的重要手段。
企业数据仓库系统的设计策略
由于众多的数据仓库系统供应商提供了大量的开发工具,因此数据仓库系统设计的重点在于系统的规划和设计选择恰当的工具。开发数据仓库的过程主要包括下面几步:
(一)数据仓库系统的总体设计
总体设计需要从业务需求分析和实现策略两个方面进行考虑。业务需求分析是在与用户充分沟通的基础上,确定开发范围、系统目标、数据来源、容量规划、开发时间、资金预算等。业务需求分析是数据仓库建设的第一步,应该准确了解用户的实际需求,避免调查失误。确定数据来源时,要对企业现有的数据体系进行全面规划,既要保证对大量的历史数据的收集存储,又要保证对不断更新数据的跟踪录入。实现策略包括运行环境、系统结构、开发工具等。数据仓库系统需要高性能的数据管理系统和并行处理技术的支持,可靠性、可扩展性是必须考虑的重要因素。
(二)逻辑模型设计
总体设计完成之后,首先要进行逻辑模型设计,即设计数据仓库数据的逻辑表现形式,建立描述企业的数据模型。数据模型是面向主题建立的,应根据主题选择数据源,确定数据集成的统一标准。设计数据仓库的逻辑模型,一般采用维数据建模方式,常用的结构形式是星型模式和雪花模式。
(三)物理模型设计
进行物理模型设计就是确定数据仓库的存储结构,确定索引策略,确定数据的存放位置,确定存储分配,即将数据仓库的逻辑模型转换成数据仓库的物理结构。数据仓库中数据的物理存储形式有多维数据存储和基于关系的数据存储。多维数据存储在逻辑上按数组保存数据,相对终端而言,是一种客户机—服务器模式。关系数据存储按关系格式存放数据,相对终端而言,采用的是三层结构,中间层完成关系模式到多维模式的转换。
(四)数据仓库的生成
该部分依据设计的数据结构和数据载入,维护策略,标示出数据源和数据仓库的硬件平台,确定传送数据的方法,定义数据采集、净化、转换、装载过程。
这一部分的支撑环境应该支持对于多种数据类型和多项筛选条件的数据的采集、整理,应具有跨平台、跨系统、高效率的抽取数据的能力。具有对劣势数据做出判断和处理的能力。具有自动选择最佳数据汇总策略,自动维护数据增量的机制。最好是采用了并行处理技术和智能化的数据分布技术。
(五)数据仓库的管理
数据仓库的管理可分为对元数据的管理和对运行过程的管理两个方面。对元数据的管理包括指示出系统各元素存放的位置,定义数据的意义和结构,数据间的影射关系,数据转换的算法、数据时限、控制信息等,对运行过程的管理是在元数据的基础上构建取用数据程序,数据转换程序、数据更新程序、运行接口程序等。这里要综合考虑选用的数据
文档评论(0)