- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析聚类分析方法在食堂消费数据中的应用论文
浅析聚类分析方法在食堂消费数据中的应用全文如下:
【摘要】:以聚类分析方法为基础,研究学校食堂消费数据,从而分析出男女生消费特点的不同,以帮助食堂改进经营策略。
【关键词】: 聚类分析 消费数据 SPSS
1 聚类分析方法
聚类分析cluster analysis是一组将研究对象分为相对同质的群组clusters的统计分析技术。聚类分析方法具有简单、直观的特点,主要应用于探索性的研究,其中变量的选择有较大的影响。
2 聚类分析基本思想
以学生的消费记录为研究对象, 使用聚类分析知识进行研究,主要使用K-Means 算法:
输入:聚类个数k 以及包含n 个数据对象的数据集;
输出:满足目标函数值最小的k 个聚类。
1计算任意两个数据对象间的距离dxi,xj;
2计算每个数据对象的密度参数,把处于低密度区域的点删除,得到处于高密度区域的数据对象的集合D;
3把处于最高密度区域的数据对象作为第1 个中心z1;
4把z1 距离最远的数据对象作为第2 个初始中心z2,z2∈D;
5令z3 为满足maxmindxi,z1, dxi,z2, i =1,2,…,n 的数据对象xi,z3∈D;
6令z3 为满足maxmindxi,z1, dxi,z2, dxi,z3, i =1,2,…,n 的数据对象xi,z4∈D;
7令zk 为满足maxmindxi,zj , i =1,2,…,n, j =1,2,…,k -1 的xi,zk∈D;
8从这k 个聚类中心出发,应用k-means 聚类算法,得到聚类。一般采用均方差作为目标测度函数: 其中E 是数据集中所有对象的均方差之和;p 是代表对象的空间中的一个点。
3 聚类分析方法在食堂消费数据中的应用
本文主要使用SPPS 工具来进行聚类分析与研究。SPSSStatistical Product and Service Solutions,统计产品与服务解决方案,是一种实现数据分析的多功能软件。
SPSS for Windows 是一种运行在Windows 系统下的社会科学统计软件包,从1968 年由美国斯坦福大学开发使用至今,在全球已经拥有数以万计的用户,在通信、医疗、银行、证券、保险、制造、商业、市场研究、科学教育等众多的行业领域都得以有效的应用,目前,SPSS 已成为世界上应用最广泛的专业统计软件之一。SPSS 软件包采用窗口操作界面,用户操作使用方便,包括数据整理、分析过程、结果输出等功能。面对庞大的数据量,SPSS 软件的功能不断完善,其统计分析方法不断充实,涵盖面越来越广,输出数据表格图文并貌,大大提高了统计分析工作的效率。
SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容包括描述统计、列联分析,总体的均值比较、相关分析、回归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类, 每个类中还有多个专项统计方法。SPSS 设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形,能够满足用户的不同需求。
聚类分析工具的应用:
1打开SPSS 软件,并输入数据,设置变量名称,在学生消费数据中选择了三十名学生的月消费情况作为分析目标,如下图所示为部分消费情况,其中男女各15 名,将性别男、女处理为二值型数据分别标记为1、2。
2每个变量设置的部分格式:
1名称:学号,类型:字符串,长度:11,对齐方式:左,测量单位:名称;2名称:性别,类型:数值,长度:1,对齐方式:右,测量单位:名称;3名称:月消费额,类型:数值,长度:6,对齐方式:右,测量单位:尺度;4名称:交易次数,类型:数值,长度:5,对齐方式:右,测量单位:尺度。
3选择“分析”—“聚类分析”—“快速聚类K”进行分析,则在出现的界面中进行如下设置:
将”变量”设置为:性别、月消费额、交易次数。
将“方法”设置为:迭代与聚类。
将“聚类数目”设置为:2。
4对“方法”、“迭代”选项进行设置,点击“确定”即出现运算过程及相应结果:
1初始聚类中心
“1”类:性别为“2”女,月消费额为278.90,交易次数为155。
“2”类:性别为“1”男,月消费额为520.10,交易次数为171。
2迭代过程
在聚类中心的变化分别为63.006、51.977。由于最大绝对坐标的变化是.000, 当前迭代是2, 最小距离是241.732,初始中心实现了最小的变化。
3最终聚类中心
您可能关注的文档
最近下载
- 四川省泸州市泸州2024-2025学年高二上学期1月期末考试语文试题含答案.docx VIP
- ★《食品安全监督管理学》最新版教案★(孙晓红李云主编版)科学出版社.docx VIP
- 人教A版2024-2025学年高中数学必修第一册期末试卷及答案.pdf VIP
- 2025林地分等定级规程.pdf
- 图集04S206自动喷水与水喷雾灭火设施安装.pptx VIP
- 浙江师范大学《高等数学A》2025-2026学年期末考试试卷(A)卷.docx VIP
- 企业合规性审查目录.docx VIP
- 多旋翼无人机操控理论考试题库及完整答案.docx VIP
- 危险货物道路运输企业安全管理规范(交运规〔2025〕6号).docx VIP
- 焊工岗前安全培训教育课件.pptx VIP
原创力文档


文档评论(0)