浅析聚类分析方法在食堂消费数据中的应用论文.docxVIP

浅析聚类分析方法在食堂消费数据中的应用论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析聚类分析方法在食堂消费数据中的应用论文 浅析聚类分析方法在食堂消费数据中的应用全文如下: 【摘要】:以聚类分析方法为基础,研究学校食堂消费数据,从而分析出男女生消费特点的不同,以帮助食堂改进经营策略。 【关键词】: 聚类分析 消费数据 SPSS 1 聚类分析方法 聚类分析cluster analysis是一组将研究对象分为相对同质的群组clusters的统计分析技术。聚类分析方法具有简单、直观的特点,主要应用于探索性的研究,其中变量的选择有较大的影响。 2 聚类分析基本思想 以学生的消费记录为研究对象, 使用聚类分析知识进行研究,主要使用K-Means 算法: 输入:聚类个数k 以及包含n 个数据对象的数据集; 输出:满足目标函数值最小的k 个聚类。 1计算任意两个数据对象间的距离dxi,xj; 2计算每个数据对象的密度参数,把处于低密度区域的点删除,得到处于高密度区域的数据对象的集合D; 3把处于最高密度区域的数据对象作为第1 个中心z1; 4把z1 距离最远的数据对象作为第2 个初始中心z2,z2∈D; 5令z3 为满足maxmindxi,z1, dxi,z2, i =1,2,…,n 的数据对象xi,z3∈D; 6令z3 为满足maxmindxi,z1, dxi,z2, dxi,z3, i =1,2,…,n 的数据对象xi,z4∈D; 7令zk 为满足maxmindxi,zj , i =1,2,…,n, j =1,2,…,k -1 的xi,zk∈D; 8从这k 个聚类中心出发,应用k-means 聚类算法,得到聚类。一般采用均方差作为目标测度函数: 其中E 是数据集中所有对象的均方差之和;p 是代表对象的空间中的一个点。 3 聚类分析方法在食堂消费数据中的应用 本文主要使用SPPS 工具来进行聚类分析与研究。SPSSStatistical Product and Service Solutions,统计产品与服务解决方案,是一种实现数据分析的多功能软件。 SPSS for Windows 是一种运行在Windows 系统下的社会科学统计软件包,从1968 年由美国斯坦福大学开发使用至今,在全球已经拥有数以万计的用户,在通信、医疗、银行、证券、保险、制造、商业、市场研究、科学教育等众多的行业领域都得以有效的应用,目前,SPSS 已成为世界上应用最广泛的专业统计软件之一。SPSS 软件包采用窗口操作界面,用户操作使用方便,包括数据整理、分析过程、结果输出等功能。面对庞大的数据量,SPSS 软件的功能不断完善,其统计分析方法不断充实,涵盖面越来越广,输出数据表格图文并貌,大大提高了统计分析工作的效率。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容包括描述统计、列联分析,总体的均值比较、相关分析、回归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类, 每个类中还有多个专项统计方法。SPSS 设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形,能够满足用户的不同需求。 聚类分析工具的应用: 1打开SPSS 软件,并输入数据,设置变量名称,在学生消费数据中选择了三十名学生的月消费情况作为分析目标,如下图所示为部分消费情况,其中男女各15 名,将性别男、女处理为二值型数据分别标记为1、2。 2每个变量设置的部分格式: 1名称:学号,类型:字符串,长度:11,对齐方式:左,测量单位:名称;2名称:性别,类型:数值,长度:1,对齐方式:右,测量单位:名称;3名称:月消费额,类型:数值,长度:6,对齐方式:右,测量单位:尺度;4名称:交易次数,类型:数值,长度:5,对齐方式:右,测量单位:尺度。 3选择“分析”—“聚类分析”—“快速聚类K”进行分析,则在出现的界面中进行如下设置: 将”变量”设置为:性别、月消费额、交易次数。 将“方法”设置为:迭代与聚类。 将“聚类数目”设置为:2。 4对“方法”、“迭代”选项进行设置,点击“确定”即出现运算过程及相应结果: 1初始聚类中心 “1”类:性别为“2”女,月消费额为278.90,交易次数为155。 “2”类:性别为“1”男,月消费额为520.10,交易次数为171。 2迭代过程 在聚类中心的变化分别为63.006、51.977。由于最大绝对坐标的变化是.000, 当前迭代是2, 最小距离是241.732,初始中心实现了最小的变化。 3最终聚类中心

文档评论(0)

软件开发 + 关注
官方认证
服务提供商

十余年的软件行业耕耘,可承接各类需求

认证主体深圳鼎云文化有限公司
IP属地湖南
统一社会信用代码/组织机构代码
91440300MA5G24KH9F

1亿VIP精品文档

相关文档