- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9.2.2 数据仓库的作用 一、客户行为分析 客户理解 行为规律分析 组间交叉分析 二、重点客户发现 潜在客户 交叉销售 增量销售 客户保持 三、个性化服务 四、市场性能评估 9.2.3 CRM数据仓库的系统结构 客户信息 客户行为 生产系统 其他相关数据 数据仓库 建设 OLAPReport 客户行为分析 重点客户发现 性能评估模板 OLAPReport 数据仓库 分析数据准备 客户分析 数据集市 运营分析等 市场专家 调度监控 9.3 数据仓库的项目实施 数据仓库系统是一种解决问题的过程,而不是一个可以买到的现成产品。不同企业会有不同的数据仓库。企业人员往往不懂如何建立和利用数据仓库,发挥其决策支持的作用,而数据仓库公司人员又不懂业务,不知道建立哪些决策主题,从数据源中抽取哪些数据。这需要双方互相沟通,共同协商开发数据仓库,因此是一个不断往复前进的过程。 数据仓库的建设是一个系统工程,是一个不断建立、发展、完善的过程,通常需要较长的时间。这就要求各企业对整个系统的建设提出一个全面、清晰的远景规划及技术实施蓝图,将整个项目的实施分成若干个阶段,以“总体规划、分步实施、步步见效”为原则,不仅可迅速从当前投资中获得收益,而且可以在已有的基础上,结合其他已有的业务系统,逐步构建起完整、健壮的数据仓库系统。 数据仓库的项目实施 数据仓库提供了有效地存取和管理大量数据的理想环境,而数据仓库系统的建立是一个由数据驱动、以技术支撑并满足应用需求的不断增长和完善的开发过程。因此数据仓库的建立可以从数据、技术和应用三方面展开。 数据仓库的项目实施 9.3.1 项目计划 项目计划是指定义创建数据仓库的项目目标和确定项目范围,包括对项目计划的评估和流程的调整。 数据仓库在构建之初应明确其主题,主题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域,针对具体决策需求可细化为多个主题表,具体来说就是确定决策涉及的范围和所要解决的问题。但是主题的确定必须建立在现有联机事务处理(OLTP)系统基础上,否则按此主题设计的数据仓库存储结构将成为一个空壳,缺少可存储的数据。但一味注重OLTP数据信息,也将导致迷失数据提取方向,偏离主题。需要在OLTP数据和主题之间找到一个“平衡点”,根据主题的需要完整地收集数据,这样构建的数据仓库才能满足决策和分析的需要。 确定范围的主要任务包括了解方向性分析处理需求,确定信息需求,确定数据覆盖范围。方向性需求包括:决策类型、决策者感兴趣的问题(或对象)等。在确定范围时应该重视的因素是必须用户驱动和数据驱动相结合,同时可以借鉴国内外已有的成功经验。 9.3.2 业务需求分析 业务需求分析是数据仓库中一个很重要的阶段,好的业务需求分析会使项目成功的机率大大增加。 分析阶段主要包括两个方面的任务是深入了解数据源和分析数据仓库系统所包含的主题域及其相互之间的关系。分析阶段必须坚持用户参与,并且与原有系统开发或维护人员进行深入的沟通。 9.3.3 数据线 数据线的实施可以分为数据仓库设计、数据预处理、数据维护三个步骤,用以满足对数据的有效组织和管理。 一、数据仓库设计 数据仓库设计分为模型设计和物理设计两个阶段: 模型设计阶段将确定数据仓库系统将来的蓝图。模型设计主要包括四个基本步骤:确定合适的主题、划分粒度层次、设计维表和设计事实表。 物理设计的主要任务是定义支持模型设计所必须得物理结构,其过程包括三个方面:确定物理存储结构、确定索引策略、确定存储分配。 粒度问题 粒度问题是设计数据仓库的一个最重要方面。 粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。 在数据仓库环境中粒度之所以是主要的设计问题,是因为它深深地影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。在数据仓库中的数据量大小与查询的详细程度之间要作出权衡。 数据仓库-模型设计 ER图 数据仓库-模型设计 三维透视图 数据仓库-模型设计 ER图中所示的数据模型中有四个相互关联的简单实体。如果数据库设计只需要考虑数据模型的话,可以推断所有的实体都是平等关系。换言之,从数据模型的设计角度来看,所有的实体之间的关系是对等的。 仅仅从数据模型的角度来着手设计数据仓库会产生一种“平面”效应。实际上,由于种种原因,数据仓库的实体绝不会是相互对等的。一些实体,要求有它们自己的特别处理。 为了明确为什么从数据模型的角度看一个组织中的数据和关系会发生失真,根据在数据仓库中建立实体时将载入数据实体的数据量,我们来考虑数据仓库中数据的一种三维透视。三维透视图表明了这种三维透视。代表供应商、客户、产品、发货的实体被稀疏地载入,而代表订单的实体则大量地载入。将会有大量的数
文档评论(0)