- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库、OLAP和数据挖掘的比较分析
我国银行的信息化可以大致划分为3个阶段:业务自动化、数据集中化、管理信息化。以工、农、中、建、交为代表的综合性大型商业银行都已陆续完成了第二阶段的转变——数据集中。如何运用银行在历年经营中积累的海量数据,利用信息技术的发展,将数据转变为信息,进而发觉其中存在的商业价值,是各大银行信息化第三阶段转变的关键。数据仓库、OLAP和数据挖掘等信息技术经历了数年的应用与发展,不断趋于成熟和完善,它们为银行的信息化管理提供了可靠的技术支撑平台。
一、数据仓库、OLAP和数据挖掘的关系和区别分析
1.数据仓库、OLAP和数据挖掘三者之间的关系
在比较成熟的系统中,数据分析过程都是基于以数据仓库为基础,OLAP和数据挖掘相辅相成的分析模式(如图1所示)。数据仓库将来自于各种数据源的数据,根据不同的主题进行存储,并对原始数据进行抽取、转换和加载等一系列筛选和清理工作。OLAP则将数据通过多维视角和多种层次向用户进行多方式的呈现。数据挖掘则应用不同的算法,向用户揭示数据间的规律性,从而辅助商业决策。比如,在银行间盛行的CRM(客户关系管理)的应用中,数据仓库以面向“客户”为主题进行数据筛选、存储;OLAP负责分析客户的基本信息、储蓄账户信息、历史余额信息、银行交易日志等,以动态分析报表、直方图、折线图、饼图等形式展现给管理者,让他们从多方面了解和掌握客户的动态,从而发现客户的交易习性、客户流失形式,更好地针对不同类型的客户,在不同时期进行适应性产品的营销活动。数据挖掘则可以通过历史数据建立模型,在拟合历史的基础上,分析未来趋势,判断哪些因素的改变将很可能意味着客户的最终流失,进而避免其发生。
2.从数据库到数据仓库
传统的数据库技术可以划分为两大类:操作型和分析型。操作型也称为事务处理,是对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,主要是为企业的特定应用服务,注重响应时间,数据的安全性和完整性;分析型是针对特定问题的联机访问和分析,通过对信息多种可能的观察形式进行稳定、一致和交互性的存取,允许分析人员对数据进行深入观察。传统数据库能够满足企业日常事务处理工作,但难以实现对数据分析和多样化处理的要求,数据仓库的出现弥补了这一缺憾,将原来以单一的数据资源,即数据库为中心的数据环境发展成为一种面向主题的体系化环境,专门用于支持高层决策分析。数据仓库并不是取代数据库,绝大部分的数据仓库还是采用关系数据库管理系统来管理数据。
3.OLAP和数据挖掘的区别与联系
OLAP和数据挖掘的主要区别在于:在辅助决策时,前者是基于用户建立的一系列假设驱动,通过OLAP来证实或者推翻这些假设,是一个演绎推理的过程;数据挖掘是通过归纳的方式,在海量数据中主动找寻模型,自动发掘隐藏在数据中的价值信息。比如:一个OLAP分析师可能认为,在某一区域开办信用卡的用户会更主动地进行消费。对于这个假定,他可能去观察在那些富裕地区申办信用卡的用户的信用卡账户属性。如果结果还不够明显,他也许要将年龄因素考虑进去。一直这样下去,直到他认为他找到了能够决定是否主动进行信用卡消费的各种变量,然后再根据这些变量,策划他的银行产品的营销方式,最大程度上将营销资源放在最可能接受他们产品的客户对象上。对于数据挖掘分析师,我们假设他也得出了和这个OLAP分析师同样的结论,但是他们得出结论的方式却孑然相反。数据挖掘分析师把各种因素或者变量放在数据挖掘工具中,由挖掘工具自行建立模型,在去除一系列与信用卡消费不相关或者不显著的因素或者变量后,也得到了同样的结果。在这里我们假设都是区域和年龄因素,当然也可能两者得出的因素或者变量不尽相同。简单地描述两者的区别:相对于OLAP,数据挖掘把更多的主动权交给了挖掘工具,在一定程度上,可以看成是人工智能的初级应用。此外,OLAP限于结构化数据,侧重与用户的交互、快速响应以及提供多维视图,而数据挖掘还可以分析诸如文本的、空间的和多媒体的非结构化数据。
虽然两者在不同角度和层面上存在很大的差异,但OLAP与数据挖掘也有一定的互补性。OLAP本身的分析结果能够为数据挖掘提供分析依据,数据挖掘可以拓展OLAP的分析深度,发掘更为复杂、细致的信息,它们之间的关系如图2所示。
二、数据仓库、OLAP和数据挖掘在银行业中的应用与比较
1.数据仓库设计
银行在近10年来的信息化进程中,从开发应用储蓄、会计、信贷、资金等业务子系统,到建立以综合业务系统为核心,其他子系统为辅助的现在银行业系统架构,积累了丰富的信息资源。面对多样化的软、硬件平台,管理者和决策者如何有效地整合分散的应用系统以提取潜在的商业价值,成为新一代银行信息化发展方向的重要课题。目前,经过市场的推广和业界的肯定,
原创力文档


文档评论(0)