《数据仓库》课程设计报告.docVIP

  • 237
  • 0
  • 约2.57千字
  • 约 8页
  • 2016-12-25 发布于重庆
  • 举报
广东海洋大学学生实验报告书(学生用表) 实验名称 关于福布斯排行榜的数据挖掘 课程名称 数据仓库设计与应用 课程号 学院(系) 信息学院 专业 信息管理与信息系统 班级 信管1124 学生姓名 刘霆钧 赵小缘 学号 201211671416 201211671431 实验地点 科技楼 实验日期 2015年11月28日 关于福布斯排行榜的数据挖掘 一、实验目的 了解数据挖掘中的聚类分析; 充分了解IBM SPSS Modeler的数据挖掘能力; 二、实验目标 理解聚类分析的概念; 对福布斯排行榜的数据(源数据来源:福布斯中文网,经过加工整理)进行聚类分析,掌握SPSS软件进行数据挖掘的常用步骤; 了解聚类分析中各个数据模型的内涵和意义。 三、实验内容及结果 用自己的话概括 数据挖掘中的聚类分析 概念。 答:聚类分析是将一组对象分成若干类,想同类中的对象具有相似性,不同类中的对象相异性较大。聚类与分类不同的是后者不依赖给定的标准给对象进行分类。 使用“福布斯排行榜”数据进行数据挖掘分析。 根据2010年至2015年福布斯企业排行榜50强在Excel表格中计算5年各自的平均销售额、平均利润、平均资产和平均市值,并在IBM SPSS Modeler中用“Excel”节点导入数据。 图 1 “2010-2015总汇”节点预览 图 2 “多重散点图”编辑

文档评论(0)

1亿VIP精品文档

相关文档