数据挖掘实验报告.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘实验报告

《数据仓库与数据挖掘》 实验报告册 20 - 20 学年 第 学期 班 级: 学 号: 姓 名: 授课教师: 杨丽华 实验教师: 杨丽华 实验学时: 16 实验组号: 1 信息管理系 目录 实验一 Microsoft SQL Server Analysis Services的使用 3 实验二 使用WEKA进行分类与预测 5 实验三 使用WEKA进行关联规则与聚类分析 6 实验四 数据挖掘算法的程序实现 7 实验一 Microsoft SQL Server Analysis Services的使用 实验类型:验证性 实验学时:4 实验目的: 学习并掌握Analysis Services的操作,加深理解数据仓库中涉及的一些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联机分析处理等。 实验内容: 在实验之前,先通读自学SQL SERVER自带的Analysis Manager概念与教程。按照自学教程的步骤,完成对FoodMart数据源的联机分析。建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析数据。 实验步骤(写主要步骤,可以打印): 1、启动联机分析管理器:开始-程序-Microsoft SQL Server-Analysis Manager。 2、按照 Analysis Service的自学教程完成对FoodMart数据源的联机分析。 3、在ODBC),数据源管理器中设置和源数据的连接“数据源名”MSSQLServerOLAPService, 启动该项服务。 在Analysis Manager中,单击服务器名称,即可建立与 Analysis Serv 的连接Analysis Servers 上单击右键,注册服务器,在服务器名称中输入本地计算机的名字,如pc56。本地计算机的名字可右击:我的电脑,选择属性,网络标志,里面有本地计算机的名字。建立新的数据库,数据库名与数据源名和早期在 ODBC 数据源管理器中建立的数据源连接 FoodMart Corporation 的数据库管理员。FoodMart 是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。市场部想要按产品和顾客分析 1998 年进行的所有销售业务数据。“Time”维度“Product”维度“Customer”维度“Store”维度“Promotion” 维度sales_fact_1998,事实表中的度量为:store_sales、store_cost、unit_sales。理解每个维度的级别。 6、可以使用多维数据集编辑器对现有多维数据集进行更改。在使用或浏览多维数据集中的数据之前,设计多维数据集中的数据和聚合的存储选项。设计好 Sales 多维数据集的结构之后,需要选择要使用的存储模式并指定要存储的预先计算好的值的数量。完成此项操作之后,需要用数据填充多维数据集。选择 MOLAP 作为存储模式,创建 Sales 多维数据集的聚合设计,然后处理该多维数据集。处理 Sales 多维数据集时将从 ODBC 源中装载数据并按照聚合设计中的定义计算汇总值。使用多维数据集浏览器,可以用不同的方式查看数据:可以筛选出可见的维度数据量,可以深化以看到数据的细节,还可以浅化以看到较为概括的数据。使用多维数据集浏览器对 Sales 数据进行切片和切块。人力资源部想按商店来分析雇员的工资。本节将建立一个 HR(人力资源)多维数据集,以进行雇员工资分析。将把 Employee(雇员)维度创建为父子维度。然后使用该维度以及常规维度来生成 HR 多维数据集。事实数据表salary(工资)维度Employee(雇员)、Store(商店)、Time(时间)维度Sales 多维数据集“Average price” 计算成员市场部希望将 Sales 多维数据集分析功能扩展到根据客户的下列特征分析客户销售数据:性别、婚姻状况、教育程度、年收入、在家子女数和会员卡。向 Customer 维度添加以下六个成员属性:Gender(性别)、Marital status(婚姻状况)、Education(教育程度)、Yearly Income(年收入)、Num Children At Home(在家子女数)和 Member Card(会员卡)。这些成员属性将限制 Customer 维度中的每个成员。? 10、已经为客户维度添加了六个成员属性创建一个带有 Y

文档评论(0)

sb250103 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档