- 9
- 0
- 约8.94千字
- 约 34页
- 2017-02-11 发布于江苏
- 举报
《数据仓库与数据挖掘》
实验报告册
2013- 2014学年 第 一 学期
班 级: T1153-8
学 号: 20110530816
姓 名: 焦 永 赞
授课教师: 杨丽华 实验教师: 杨丽华
实验学时: 16 实验组号: 1
信息管理系
目录
实验一 Microsoft SQL Server Analysis Services的使用 3
实验二 使用WEKA进行分类与预测 15
实验三 使用WEKA进行关联规则与聚类分析 22
实验四 数据挖掘算法的程序实现 28
实验一 Microsoft SQL Server Analysis Services的使用
实验类型:验证性 实验学时:4
实验目的:
学习并掌握Analysis Services的操作,加深理解数据仓库中涉及的一些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联机分析处理等。
实验内容:
在实验之前,先通读自学SQL SERVER自带的Analysis Manager概念与教程。按照自学教程的步骤,完成对FoodMart数据源的联机分析。建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析数据。
实验步骤(写主要步骤,可以打印):
启动联机分析管理器:开始-程序-Microsoft SQL Server-Analysis Manager。
按照 Analysis Service的自学教程完成对FoodMart数据源的联机分析。
在ODBC),数据源管理器中设置和源数据的连接“数据源名”………….”的数据源
(4)添加,选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完成”按钮在“ODBC Microsoft Access 安装”对话框中单击“确定”按钮。 在“ODBC 数据源管理器”对话框中单击“确定”按钮。MSSQLServerOLAPService, 启动该项服务。
在Analysis Manager中,单击服务器名称,即可建立与 Analysis Serv 的连接Analysis Servers 上单击右键,注册服务器,在服务器名称中输入本地计算机的名字,如pc56。本地计算机的名字可右击:我的电脑,选择属性,网络标志,里面有本地计算机的名字。建立新的数据库,数据库名与数据源名和早期在 ODBC 数据源管理器中建立的数据源连接MSSQLServerOLAPService服务
(2)注册服务器
(3)建立名为“………”的新数据库
(4)建立数据源
5、假设你是 FoodMart Corporation 的数据库管理员。FoodMart 是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。市场部想要按产品和顾客分析 1998 年进行的所有销售业务数据。“Time”维度“Product”维度“Customer”维度“Store”维度“Promotion” 维度sales_fact_1998,事实表中的度量为:store_sales、store_cost、unit_sales。理解每个维度的级别。(1) “Time”维度Product维度
(3)“Customer”维度“Store”维度“Promotion” 维度使用多维数据集编辑器对现有多维数据集进行更改。在使用或浏览多维数据集中的数据之前,设计多维数据集中的数据和聚合的存储选项。设计好 Sales 多维数据集的结构之后,需要选择要使用的存储模式并指定要存储的预先计算好的值的数量。完成此项操作之后,需要用数据填充多维数据集。选择 MOLAP 作为存储模式,创建 Sales 多维数据集的聚合设计,然后处理该多维数据集。处理 Sales 多维数据集时将从 ODBC 源中装载数据并按照聚合设计中的定义计算汇总值。使用多维数据集浏览器,可以用不同的方式查看数据:可以筛选出可见的维度数据量,可以深化以看到数据的细节,还可以浅化以看到较为概括的数据。使用多维数据集浏览器对 Sales 数据进行切片和切块。人力资源部想按商店来分析雇员的工资。本节将建立一个 HR(人力资源)多维数据集,以进行雇员工资分析。将把 Employee(雇员)维度创建为父子维度。然后使用该维度以及常规维度来生成 HR 多维数据集。事实数据表salary(工资)维度Employee(雇员)、Store(商店)、Time(时间)维度Sales 多维数据集“Average price” 计
原创力文档

文档评论(0)