数据挖掘中基于肘部法则的聚类分析在中小学生出行路线优化设计的应用!.pdfVIP

数据挖掘中基于肘部法则的聚类分析在中小学生出行路线优化设计的应用!.pdf

  1. 1、本文档共1页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘中基于肘部法则的聚类分析在中小学生出行路线优化设计的应用!.pdf

ELECTRONICS WORLD ・技术交流 数据挖掘中基于肘部法则的聚类分析在中小学生出行路线优化设计的应用 沈阳理工大学自动化与电气工程学院 郑英鑫 【摘要】 本文介绍了在数据挖掘中,采用K-Means聚类分析算法对数据进行分析与挖掘。但由于K-Means使用时,初始重心是随机选取的, 因此很容易陷入局部最优解。为解决该问题,引入了肘部法则(Elbow)。K-Means通常初始时要重复运行十几次甚至上百次,这时采用肘 部法则计算出最小的成本函数对应的重心位置作为初始化位置,就很好的改善了局部最优解问题。 【关键词】 聚类分析;K-Means算法;肘部法则 致K-Means 陷入局部最优解,这样分类可能失去了实际意义。为了 1.引言 避免局部最优解,K-Means通常初始时要重复运行十几次甚至上百 次。每次重复时,它会随机的从不同的位置开始初始化。最后把最 “数据挖掘(Data Mining) ”这个概念最早是由Usama Fay - 小的成本函数对应的重心位置作为初始化位置。 aad1995年加拿大蒙特利尔的第一届知识发现和数据挖掘国际会议 肘部法则 (Elbow )会把不同K值的成本函数值画出来。随着K [1] 上提出的。数据挖掘是从大量的数据中 “挖掘”或者提取知识 。 值的增大,平均畸变程度会减小。每个类包含的样本数会减少,于 数据挖掘的知识模式有:概念/类描述、关联模式、分类、聚类分 是样本离其重心会更近。但是,随着K值继续增大,平均畸变程度 析、预测、时间序列、偏差检测。 的改善效果会不断减低。K值增大过程中,畸变程度的改善效果下 数据挖掘源于多个学科,将聚类分析应用到数据挖掘这样一个 降幅度最大的位置对应的K值就是肘部。 多学科交叉的复杂领域,必定需要满足一些要求,主要标准有:可 伸缩性、能够发现任意形状的簇、能够处理不同数据类型属性、能 4.仿真结果 够处理带噪声的数据、高维性、对于决定输入参数的领域知识需求 最小化、对于输入记录的次序不敏感性和允许增量聚类、基于约束 运用K-Means聚类算法及肘部法则解决中小学生出行路线优化 的聚类、可解释性和可用性。在保证这些要求的前提下,合理运用 设计中校车停车站点数目及位置的选取问题。 聚类分析算法对数据进行分析与挖掘。 针对单个学校的校车停车站点的位置选取。运用K-Means聚类 算法,以欧式距离作为判断各点相似度的依据,均方差作为测度函 2.K-Means聚类算法 数,找出K个聚类中心即得到K个校车停车站点的位置。其中问题 中没有指定K 的值,因此可以通过肘部法则进而合理地选定该校校 K-Means算法是1967年由MacQueen首次提出的一种经典算法, 车的停车站点的数量K作为聚类的类别数,本论文中数据来源于某 经常用于数据挖掘和模式识别中,是一种无监督式的学习算法,其 市某十所学校,分别包括每个学校每个学生具体的位置,上学和放 使用目的是对几何进行等价类的划分,即对一组具有相同数据结构 学的具体出行方式及上学的具体时间,是否有乘坐校车的意愿和每 的记录按某种分类准则进行分类,以获取若干个同类记录集[2] 。 个学校及其校门的具体地址。由Matlab仿真后,结果表明,基于肘 K-Means算法具体实现步骤: 部法则确定的站点数目及

文档评论(0)

小马过河 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档