利用olap进行数据分析的实例.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用 OLAP 进行数据分析的实例 —基于 foodmart 数据库 专业:地理信息系统 学号: 0210614 姓名:王威 数据仓库技术越来越受到广泛的关注,越来越多的公司意识到建立 OLAP 所能带来的好处。利用 OLAP 机型数据分析,可以帮助决策者从多个角度观察 数据,帮助公司管理特定领域的目标销售、项目进展,以及预测发展趋势。多维 数据分析工具就是帮助进行多角度的数据分析。 FoodMart 是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。 现在假定我是 FoodMart Corporation 的数据库管理员。市场部想要按产品和 顾客分析 1998 年进行的所有销售业务数据。使用存储在公司数据仓库中的数 据,建立多维数据结构(多维数据集) ,以便在市场分析人员查询数据库时获取 快速的响应。 在进行分析之前,现拟定分析需求。这样就有针对性和目的性了。因为 foodmart 数据库是一个大型数据库, 里面有 20 多张表的数据, 根据分析需求, 只需要找到跟我的需求相关的表和字段,这样就可以做到高效、省时、准确。 下面是我拟定的分析需求,它从主题、数值、角度、粒度等几个方面进行 需求分析,为后面的工作做好准备。 分析的主题:按产品、顾客分析 98 年的销售业务 分析的数值(事实):销售、成本和预算数据 分析的角度(维度):时间、商品、客户、商店、促销 分析的粒度:时间 —年、季度、月 产品 —种类、子类、商标名 顾客—国家、州、城市、姓名 商店 —国家、州、城市、商店名、促销 经过和源数据的连接,准备好数据后。开始进行建立多维数据集。 多维数据集是数据的一种多维结构。多维数据集由维度和度量值的集合进 行定义。以多维方式建立数据模型可简化联机业务分析, 提高查询性能。 通过创 建数据多维数据集, Analysis Manager 可将存储在关系数据库中的数据转换 为具有实际含义并且易于查询的业务信息,用于进行业务分析。 1. 向多维数据集添加度量值 度量值是要进行分析的数据库中的量化值。 常用的度量值为销售、 成本 和预算数据。度量值根据多维数据集不同的维度类别进行分析。 2. 建立各维度 主要包括时间维度、产品维度、客户维度、商店维度、促销维度。管理 关系数据以进行多维使用的最常用的方式是星型架构。 星型架构由一个事实 数据表和链接到该事实数据表的多个维度表组成。但在上边的维度里面,产 品维度使用的是雪花架构,在“选择维度表”步骤中,将 product 和 product_class 添加到“选定的表” ,由他们组成了雪花型。 在以上多维数据集生成后,在多维数据集编辑器中生成了一个架构图。从 架构图中,我们可以直观清晰的看到几个维度之间的关系。 设计存储和处理多维数据集是建立多维数据集后有一项重要的步骤。可以 设计多维数据集中的数据和聚合的存储选项。 在使用或浏览多维数据集中的数据 之前,必须先进行处理。可以从三种存储模式中选择:多维 OLAP (MOLAP) 、 关系 OLAP (ROLAP) 或混合 OLAP (HOLAP) 。 Microsoft Analysis Services 允许设置聚合。聚合为预先计算好的汇总数据,利用这些数据可以极 大地提高查询的效率和响应时间。 在处理多维数据集时, 将计算为多维数据集所 设计的聚合,并为多维数据集装载已计算的聚合和数据。 对于本例, 设计好 Sales 多维数据集的结构之后, 需要选择要使用的存储 模式并指定要存储的预先计算好的值的数量。 完成此项操作之后, 需要用数据填 充多维数据集。本例中选择使用 MOLAP 作为存储模式,创建 Sales 多维数据 集的聚合设计,然后处理该多维数据集。处理 Sales 多维数据集时将从 ODBC 源中装载数据并按照聚合设计中的定义计算汇总值。 最后就是浏览多维数据集中的数据,根据需要进行相应的分析。使用多维 数据集浏览器, 可以用不同的方式查看数据: 可以筛选出可见的维度数据量, 可 以深化以看到数据的细节,还可以浅化以看到较为概括的数据。 在本例中, Sales 多维数据集已经过处理,数据可用来进行分析。下面将 使用多维数据集浏览器对 Sales 数据进行切片和切块分析操作。 用浏览数据命令打开 Sales 多维数据集后,出现多维数据及浏览器,显示 由多维数据集的一个维度和度量值组成的网格。 其它四个维度在浏览器上方。我 们假定按时间筛选数据,点开 Time维的箭头,展开所有Time和1998节点, 然后查看第四季度,将对网格中的数据进行筛选,是筛选出的数据为仅反映该季 度情况的数字。 如果要对数据更近一步深化查看,可以使用拖放的方法,将一个维单击并 拖到另一个维度上,比如单击 Product,并将其拖到Country

文档评论(0)

wumanduo11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档