多维数据的组织与分析.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多维数据的组织与分析

昆明理工大学信息工程与自动化学院学生实验报告( 2016—2017学年第二学期)课程名称:数据仓库与数据挖掘 开课实验室:信自楼444 2017年5 月4 日年级、专业、班软件141班学号2014104131xx姓名陈*成绩实验项目名称多维数据组织与分析指导教师 贾连印教师评语该同学是否了解实验原理:A.了解□B.基本了解□C.不了解□该同学的实验能力:A.强 □B.中等 □C.差 □该同学的实验是否达到要求:A.达到□B.基本达到□C.未达到□实验报告是否规范:A.规范□B.基本规范□C.不规范□实验过程是否详细记录:A.详细□B.一般 □ C.没有 □ 教师签名: 年 月 日上机目的目的:1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;2.理解多维数据集创建的基本原理与流程;3.理解并掌握OLAP分析的基本过程与方法;4. 学会使用基本的MDX语句二、上机内容基于上次实验建立的地铁数据仓库,构建地铁公司收入的多维数据集。使用维度浏览器进行多维数据的查询、编辑操作。对多维数据集进行切片、切块、旋转、钻取操作。使用MDX语句对多维数据集进行切片。注意:可参照Analysis Services的教程,构建多维数据集。要求时间和站点维度采用层次结构。利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。三、实验原理及基本技术路线图(方框原理图或程序流程图)请描述联机分析处理的相关基本概念(MOLAP、ROLAP、切片、切块、旋转、钻取等)。MOLAP:表示基于多维数据组织的OLAP实现。使用多维数组存储数据。特点:将细节数据和聚合后的数据均保存在cube中,所以以空间换效率,查询时效率高,但生成cube时需要大量的时间和空间。ROLAP:表示基于关系数据库的OLAP实现。将多维数据库的多维结构划分为事实表,和维表。特点:将细节数据保留在关系型数据库的事实表中,聚合后的数据也保存在关系型的数据库中。这种方式查询效率最低,不推荐使用。切片:在给定数据立方体的一个维上进行选择操作就是切片,切片的结果是得到一个二维平面数据。切块:在给定数据立方体的两个或多个维上进行选择操作就是切块,切块的结果得到一个子立方体。旋转:维度变换的方向,即在表格中重新安排维的放置(例如行列互换)。钻取:改变维的层次,变换分析的粒度。它包括向下钻取和向上钻取。四、实验方法、步骤(或:程序代码或操作过程)多维数据集卡类型维度卡类别维度时间维度站点维度进出站多维数据集建立处理多维数据集部署完成钻取旋转切片切块五、实验过程原始记录( 测试数据、图表、计算等)多维数据集钻取旋转切片切块六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必须用计算纸或程序运行结果、改进、收获)通过本次实验,我们理解了OLAP的多维数据分析的概念,简单实现了一个多维数据分析模型,对多维数据分析的基本操作(切片、切块、钻取、旋转)有一个基本的认识。在进行模型建立过程中,因为建立数据仓库过程中数据导入问题,需要我们重新检查数据仓库的ETL过程,寻找问题并予以解决,这一过程是一个循环往复的过程,直至所有问题都得以解决,OLAP的多维数据集才能顺序建立并进行相关操作,所以在ETL过程中认真细心,尽量考虑周全,可以避免建立OLAP多维数据集时的很多问题

文档评论(0)

liwenhua00 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档