- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库在现代化企业管理中的应用研究.doc
数据仓库在现代化企业管理中的应用研究
【摘 要】现代化企业管理的主要模式就是依靠大量的数据计算、统计和分析来辅助管理者做出更加科学合理的决策,而现代企业信息正面临着业务种类繁多、信息量大、数据变化快、数据间关联性复杂等问题。通过应用数据仓库技术,可以方便的对企业各部门的业务数据进行整合与分析,找出其中的关联性,形成有价值的分析报告提交管理层,本文从数据仓库的应用出发,阐述了数据仓库内部各个模块的搭建过程和在企业中的应用模式,具有一定的实践意义和参考价值。
【关键词】企业管理;数据仓库;OLAP;数据挖掘;数据集市
1 引言
随着现代化企业信息管理系统的普及应用,企业间的业务交流越来越广泛,以往单一的数据库系统已经无法应对这种信息量大、变化速度快的数据分析需求,因此企业不得不寻求一种将多个数据平台联系在一起,并从以往海量数据中解析出有价值的信息,进一步对其关联性进行统计和分析的解决方案,这就是数据仓库技术诞生的原动力,目前,数据仓库技术已经得到了广泛的应用,成为了各个企业决策支持系统( DSS)处理的基础,而联机分析处理(Online Analytieal Proeessing,OLAP)也成为了数据仓库最主要的数据处理模式之一。
2 数据仓库技术特征
数据仓库的特征可以归纳为以下四个方面:
(1)面向主题组织:与传统数据库技术面向数据应用不同的是,数据仓库是面向主题组织的。数据库这种较低层次的数据处理原则使得用户必须另外花费大量时间和精力来进行数据分析,才能获得有价值的信息。而数据仓库面向主题组织,首先就从高层次将数据按需求进行归类,每个主题基本对应一个分析领域。该领域内可能包含多个数据库中的数据,而各领域之间通过预留端口进行沟通,这样某个领域引用其他领域的分析结果时,就像调用某个程序一样方便。
(2)集成性:该特征是数据仓库高效处理数据的基础。数据仓库从各个数据源将数据提取至某个主题,而这些数据可能会出现重复和逻辑矛盾等情况,因此这些数据必须经过预处理后才能被引用,这就是数据集成。另一方面,数据仓库引入了数据粒度的概念,即采用粒度值来划分数据的细化和综合程度,也体现了数据集成的效果。
(3)稳定性:稳定性是所有数据中心都追求的性能之一,而数据仓库的稳定性体现在其并不会对数据源进行任何修改和删除,仅仅是将其提取出来进行统计分析,相当于只对数据副本进行操作,而且数据仓库大多时候是对长期的历史数据进行分析,这也使得数据仓库的处理对象本身就具有一定的稳定性,不会因为数据仓库的操作而影响实时性较高的敏感数据。
(4)时态性:数据仓库的这一特征是最不明显的,因为其处理的对象是大量的历史数据,而新数据的不断积累当然会对数据群带来一定的影响,但需要指出的是,历史数据量越大,这种影响越小,因此在进行数据分析时,必须通过采取不同的权值来设定新、旧数据的影响程度。
3 数据仓库主要应用方案
目前,绝大部分能够提供数据仓库服务的公司提供的解决方案都大致相同,即先通过数据综合分析将数据有计划的放到数据仓库中对应的主题领域内,然后通过前台接口与用户进行交互,提供查询、交叉分析等服务,目前主要用到的前台接口有两种,即联机分析处理(OLAP)和数据挖掘(DM),图1为数据仓库的基本结构。
图1 企业数据仓库基本结构
3.1 联机分析处理OLAP
OLAP是一种联合多个数据库中的数据共同来完成数据统计与分析的商业信息处理系统,其最大的功能在于对多维结构数据的处理上,它可将数据仓库的数据加以筛选、分析、总汇而产生新的更具代表意义的数据,并允许用户通过不同的方式,如趋势图等来演示该数据,某一主题生成的数据同样对其他主题具有影响意义,因此也可以通过其他主题的模型来演示该数据,让用户通过系统提供的多种工具从不同侧面、不同层次以及在不同数据群体中的对比分析爱来进一步了解该数据所带来的指导意义。
3.2 数据挖掘
数据挖掘技术是近些年来发展较快的信息处理技术,其特点是利用分类、关联性分析、序列分析、群集分析、机器学习以及融合一些人工智能算法,来对庞大的海量数据进行处理,提取出有价值的信息。这对积累了大量历史数据企业而言是非常重要的,因为庞大的数据基数,导致数据分析的计算量非常大,尤其当一些重要的数据或关联隐藏在大规模数据中是,想要将其解析出来无异于大海捞针。而数据挖掘技术采用客观的统计分析方法快速准确的找出企业所需要的经营信息,得到正确的销售模式、客户关系及行销策略等,从而使得企业的投资决策更加合理,资源分配更加科学。
3.3 数据集市
数据集市本质上也是数据仓库的一种,只不过它是某个部门或某个重要业务的具体应用,包括该部门或该项目在一定时期内的数据
文档评论(0)