- 237
- 0
- 约2.57千字
- 约 8页
- 2016-12-25 发布于重庆
- 举报
广东海洋大学学生实验报告书(学生用表)
实验名称 关于福布斯排行榜的数据挖掘 课程名称 数据仓库设计与应用 课程号 学院(系) 信息学院 专业 信息管理与信息系统 班级 信管1124 学生姓名 刘霆钧
赵小缘 学号 201211671416
201211671431 实验地点 科技楼 实验日期 2015年11月28日
关于福布斯排行榜的数据挖掘
一、实验目的
了解数据挖掘中的聚类分析;
充分了解IBM SPSS Modeler的数据挖掘能力;
二、实验目标
理解聚类分析的概念;
对福布斯排行榜的数据(源数据来源:福布斯中文网,经过加工整理)进行聚类分析,掌握SPSS软件进行数据挖掘的常用步骤;
了解聚类分析中各个数据模型的内涵和意义。
三、实验内容及结果
用自己的话概括 数据挖掘中的聚类分析 概念。
答:聚类分析是将一组对象分成若干类,想同类中的对象具有相似性,不同类中的对象相异性较大。聚类与分类不同的是后者不依赖给定的标准给对象进行分类。
使用“福布斯排行榜”数据进行数据挖掘分析。
根据2010年至2015年福布斯企业排行榜50强在Excel表格中计算5年各自的平均销售额、平均利润、平均资产和平均市值,并在IBM SPSS Modeler中用“Excel”节点导入数据。
图 1 “2010-2015总汇”节点预览
图 2 “多重散点图”编辑
原创力文档

文档评论(0)