- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
MCI电话公司 以customer marketing warehouse进行趋势分析、估算促销成本、客户维持率分析,从而能得知采取便宜且更为有效的选择性促销方式。 Wal-Mart连锁零售商店 分析顾客每次采购的物品、时间及物品的摆置地点等,找出其中关联性,并据此决定每一家店的进货方式、促销战略与店面货物的最有效排列方式。 美国联邦住宅局 利用数据仓库将10年来分散于70多个系统中的预算与会计资料整合起来,供预算预测、支出分析、趋势分析、方案评比及政策分析之用。 Visa会员银行 利用数据仓库CRIS(cardholder risk information service)分析,帮助银行发现欺诈的行为模式,减少了16%的伪造信用卡损失。 分析工具 关系数据库 数据文件 其他数据 数据仓库管理工具 抽取、转换、装载 元数据库 数据建模工具 综合数据 当前数据 历史数据 用户查询工具 C/S工具 OLAP工具 数据挖掘工具 源数据 仓库管理 数据仓库 概念模型是对事物的概括和抽象。概念模型独立于机器,反映了事物和事物之间的联系,具有简明、易理解的特点。 数据仓库的数据概念模型是多维数据模型。 在数据仓库中,维是同类数据的集合,是组织数据的变量,也是重要的决策因素。 多维数据模型的示例 北京 1 牛奶 面包 啤酒 可乐 黄油 商品(工业-类别-商品) 城市(国家-省-市) 日期(年-月-日) 2 3 4 5 6 7 上海 广州 天津 星型模型 大多数数据仓库都采用星型模型来表示多维数据模型。 星型模型包括一个事实表和多个维表,其中的事实表和维表都是关系表。 事实表包含数据仓库中的测量数据和指向与测量数据相关的其他维表的外键指针,每个外键指针指向一个维表。 维表记录每一维的主键和相关因素的属性,每个维表对应多维模型中的一维,它们形成了概念模型的多维层次联系。 销售表 客房表 订单号 销售员号 客户号 产品号 日期标识 地区标识 数量 总价 订单号 订货日期 客户号 客户名称 客户地址 销售员号 销售员姓名 城市 产品号 产品名称 产品目录 单价 日期标识 日 月 年 地区名称 省别 订货表 地区表 产品表 日期表 事实表 图5-9 星型模型 星型模型 雪花模型 雪花模型是对星型模型的扩展。它通过对星型模型维表进一步细化,使原有的一些维表被扩展为更小的事实表,形成由一些局部星型模型所组成的多层次结构。 维表细化的目的是通过减少数据存储量和联合较少的维表来改善查询性能。 地区表 目录表 客房表 事实表 年表 月表 销售表 订单号 销售员号 客户号 产品号 日期标识 地区标识 数量 总价 订单号 订货日期 客户号 客户名称 客户地址 销售员号 销售员姓名 城市 产品号 产品名称 产品目录 单价 日期标识 日 月 年 地区名称 省别 订货表 产品表 日期表 图5-10 雪花模型 产品目录 目录描述 月份 年 年 省表 省别 雪花模型 数据集市(Data Marts)是一种更小、更集中的数据仓库;数据集市面向特定应用,主要针对具体的、部门级的应用。 数据集市的特征 规模小,面向部门,有特定的应用 由业务部门定义、设计、开发、管理和维护 能快速实现 购买比较便宜,投资回收快 工具集的紧密集成 提供更详细的、预先存在的、数据仓库的摘要子集 可升级到完整的数据仓库。 数据仓库和数据库的比较 作业用数据处理特性(数据库) 分析用数据处理特性(数据仓库) 数据特性 无重复数据 重复数据 详细、少量汇总(微观) 详细、大量汇总(宏观) 数据处理量(数个月) 数据处理量(5-10年) 经常移动 不常移动 作业特性 提供作业阶层数据处理服务 提供管理阶层信息服务 支持每日交易的操作(增添、删除、查询、打印) 支持管理决策的需求(查询、打印) 联机事务处理(OLTP) 联机分析处理(OLAP) 要求操作有效率且快速回应 对效率及快速回应不特别要求 开发 特性 软件开发生命周期 动态反复分析 交易系统导向、适于大量交易 决策分析导向、适于复杂查询 使用数据仓库时需重点考虑的问题 企业是否真正需要数据仓库 数据仓库与数据挖掘工具时十分昂贵的,而且需要不断地得到扩展的和昂贵的支持。 有些企业并不需要数据仓库,若能从业务数据库中轻而易举地获取决策所必需的信息,就没必要采用数据仓库。 企业员工需要整个数据仓库吗 如果不是这样,就应考虑建立数据集市。 怎样更新信息 为创建数据库,可以用“快照”(snapshot)方式从其他数据库中提取信息,并导入数据仓库,但如果关键的信息要做到即时更新,则往往是不可行的。 案例:金融业数据仓库解决方案 数据仓库是金融银行机构实现客户关系管理的核心技术,也是金融银行业竞争优势的来源,主要的应用业务部门为信用卡部
原创力文档


文档评论(0)