.一类聚类算法的MATLAB实现.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一类聚类算法的MATLAB实现

云南民族大学数学与计算机科学院 王军 一类聚类算法的MATLAB实现 * 划分法算法 扩展 扩展 离散型数据 混合型数据 数值型数据 扩展 扩展 大型数据库 大型数据库 * * 算法 输入:簇的数目k和包含n个对象的数据库. 输出:k个簇,使平方误差准则最小. (1) 任意选择k个对象作为初始的簇中心 (2) (3)    分配到最邻近的簇. (4) /*更新簇平均值*/. (5) 计算 /*计算准则函数E */. (6) E 不再明显地发生变化。 * 算法优缺点 主要优点: i.是解决聚类问题的一种经典算法,简单,快速. ii.对处理大数据集,该算法是相对可伸缩和高效率的. iii.当结果簇是密集的,它的效果较好. 主要缺点: i.在簇的平均值被定义的情况下才能使用,可能不适用于某 些应用. ii.必须事先给出k(要生成的簇的数目)而且对初值敏感,对于 不同的初始值,可能会导致不同结果. iii.不适合于发现非凸面形状的簇或者大小差别很大的簇.而 且,它对于“噪声”和孤立点数据是敏感的. * 与 算法 K-modes算法: 1)K-means算法只适用于数值型数据. 2)K-modes算法实现了对离散型数据的快速聚类,保留了 K-means 算法的效率,同时将算法的应用范围扩大到 离散型数据. K-prototypes算法: 1)算法可以对离散型与数值型属性两种混合的数据进行 聚类,在中定义了一个对数值型与离散型属性都计算的 相异性度量标准. 2)度量具有混合属性的方法是,数值属性采用K-means得 到P1,分类属性采用K-modes, 那么 D=P1+a*P2,a是权 重,如果觉得分类属性重要则增加a,否则减少a,当a=0时 即只有数值属性. * 算法 K-modiods算法 输入:簇的数目k和包含n个对象的数据库. 输出:k个簇,使得所有对象与其最近中心点的相异度总和最小. (1) 任意选择k个对象作为初始的簇中心点; (2) (3) 指派每个剩余的对象给离它最近的中心点所代表的簇; (4) (5) 选择一个未被选择的中心点 ; (6)   (7) 选择一个未被选择过的非中心点对象 ; (8) 计算用 代替 的总代价并记录在 中; (9)   所有的非中心点都被选择过; (10) 所有的中心点都被选择过; (11) 在 中的所有非中心点代替所有中心点后的计算出的总代价有小 于0的存在, 找出 中的用非中心点替代中心点后代价最小的 一个,并用该非中心点替代对应的中心点,形成一个新的k个中心点 的集合; (12) 没有再发生簇的重新分配,即所有的 都大于0. * 算法 算法: 输入:簇的数目k和包含n(n很大)个对象的数据库. 输出:k个簇,使得所有对象与其最近中心点的相异度总和最小. (1) (选样的次数) 重复执行下列步骤(2)-(4) ). (2) 随机地从整个数据库中抽取一个 (例如:(40+2k))个对象的样 本,调用 从样本中找出样本的 个最优的中心点. (3)将这 个中心点应用到整个数据库上,对于每一个非代表对象 , 判断它与从样本中选出的哪个代表对象最近. (4) 计算上一步中得到的聚类的总代价. 若该值小于当前的最小值,用 该值替换当

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档