商业智能――发掘数据金矿工具.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商业智能――发掘数据金矿工具

商业智能――发掘数据金矿工具   [摘要] 本论文先简单地说明企业经营管理活动对商业智能的需求,从而明确实施商业智能(BI)的原因,解决Why的问题;再阐明商业智能的技术构成,如数据仓库(DW)、数据挖掘(DM)、联机在线分析工具(OLAP)等进行概要的分析,大概了解如何实现商业智能,解决What和How的问题;最后列举一些实际部署的商业智能项目结果,解决What Effect的问题,明确商业智能在企业经营决策过程中的具有很高的实用价值。   [关键词] 商业智能 数据挖掘 ETL OLAP      一、商业智能概念提出的背景和定义   商业智能(Business Intelligence ,简称BI)的概念最早是 Gartner Group 于 1996 年提出来的。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商资料来自企业所处行业和竞争对手的数据,以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。   为此,把商业智能看成是一种解决方案应该比较恰当。BI的关键是从许多来自不同的企业运作系统的数据中,提取出有用的数据,进行清理以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即 ETL 过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。因此,BI是涉及一个很宽领域的,集收集、合并、分析和提供信息存取功能??一身的解决方案,包括 ETL 软件、数据仓库、数据集市、数据查询和报告、多维/联机数据分析、数据挖掘和可视化工具。 图1是一个典型的商业智能系统。   图1 商业智能系统构图   二、商业智能的技术构成   商业智能所要解决的问题不同,其应用到的技术也不尽相同,一般地讲包括以下的部分(不同的体系,划分的方法可能有些差别,但本质相同)。   1.ETL:即数据的抽取/转换/加载。也就是将原来不同形式、分布在不同地方的数据,转换到一个整理好、统一的存放数据的地方(数据仓库)。ETL可以通过专门的工具来实现,也可以通过任何编程或类似的技术来实现。   2.数据仓库:一个标准的定义是:数据仓库是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。简单地说,数据仓库就是储存数据的地方。它既可能是原始的业务数据库,也可能是另外生成的。既可能是标准的关系型数据库,也可能是包括了一些特定面向分析特性的专门产品。   3.查询:找出所需要的数据。由于需求的多样性和复杂程度的差异,查询可能是最简单的从一张表中找出“所有姓张的人”,到基于非常复杂的条件、对关系非常复杂的数据进行查找和生成复杂的结果。   4.报表分析:以预先定义好的或随时定义的形式查看结果和分析数据。将人工或自动查询出来的数据,以所需要的形式(包括进行各种计算、比较,生成各种展现格式,生成各种图表等)展现给用户,甚至让用户可以进一步逐层深入钻取这些数据,乃至灵活地按照各种需求进行新的分析并查看其结果。在这个领域,报表已经由原来狭义的做好固定报表发展为灵活地按业务要求随时制作各种报表、进行各种分析和数据研究处理。   5.OLAP分析:多维数据分析,从多个不同的角度立体地同时对数据进行分析。理解OLAP分析,最简单的例子是Excel中的数据透视表。需要指出的是,OLAP有广义与狭义之分,广义的OLAP是相对OLTP而言,可以说包括了查询、报表分析、OLAP分析和数据挖掘,但真正大家所讲的实际是狭义的OLAP,即多维数据分析。OLAP分析一般讲应该是通过建模和建立立方体(CUBE)来实现,但现在也有一些简单的OLAP工具可以不建模即进行小数据量、低复杂度的分析(EXCEL的数据透视表即是一例)。   6.数据挖掘:一种在大型数据库中寻找你感兴趣或是有价值信息的过程。相比于上面几个部分,数据挖掘是最不确定的。如果理解它与查询的区别,似乎是数据如果容易查出来,就是查询。如果费很大劲

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档