- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一类聚类算法的matla实现一类聚类算法的matlab实现
云南民族大学数学与计算机科学院 王军 算法 输入:簇的数目k和包含n个对象的数据库. 输出:k个簇,使平方误差准则最小. (1) 任意选择k个对象作为初始的簇中心 (2) (3) 分配到最邻近的簇. (4) /*更新簇平均值*/. (5) 计算 /*计算准则函数E */. (6) E 不再明显地发生变化。 算法优缺点 主要优点: i.是解决聚类问题的一种经典算法,简单,快速. ii.对处理大数据集,该算法是相对可伸缩和高效率的. iii.当结果簇是密集的,它的效果较好. 主要缺点: i.在簇的平均值被定义的情况下才能使用,可能不适用于某 些应用. ii.必须事先给出k(要生成的簇的数目)而且对初值敏感,对于 不同的初始值,可能会导致不同结果. iii.不适合于发现非凸面形状的簇或者大小差别很大的簇.而 且,它对于“噪声”和孤立点数据是敏感的. 与 算法 K-modes算法: 1)K-means算法只适用于数值型数据. 2)K-modes算法实现了对离散型数据的快速聚类,保留了 K-means 算法的效率,同时将算法的应用范围扩大到 离散型数据. K-prototypes算法: 1)算法可以对离散型与数值型属性两种混合的数据进行 聚类,在中定义了一个对数值型与离散型属性都计算的 相异性度量标准. 2)度量具有混合属性的方法是,数值属性采用K-means得 到P1,分类属性采用K-modes, 那么 D=P1+a*P2,a是权 重,如果觉得分类属性重要则增加a,否则减少a,当a=0时 即只有数值属性. 算法 K-modiods算法 输入:簇的数目k和包含n个对象的数据库. 输出:k个簇,使得所有对象与其最近中心点的相异度总和最小. (1) 任意选择k个对象作为初始的簇中心点; (2) (3) 指派每个剩余的对象给离它最近的中心点所代表的簇; (4) (5) 选择一个未被选择的中心点 ; (6) (7) 选择一个未被选择过的非中心点对象 ; (8) 计算用 代替 的总代价并记录在 中; (9) 所有的非中心点都被选择过; (10) 所有的中心点都被选择过; (11) 在 中的所有非中心点代替所有中心点后的计算出的总代价有小 于0的存在, 找出 中的用非中心点替代中心点后代价最小的 一个,并用该非中心点替代对应的中心点,形成一个新的k个中心点 的集合; (12) 没有再发生簇的重新分配,即所有的 都大于0. 算法 算法: 输入:簇的数目k和包含n(n很大)个对象的数据库. 输出:k个簇,使得所有对象与其最近中心点的相异度总和最小. (1) (选样的次数) 重复执行下列步骤(2)-(4) ). (2) 随机地从整个数据库中抽取一个 (例如:(40+2k))个对象的样 本,调用 从样本中找出样本的 个最优的中心点. (3)将这 个中心点应用到整个数据库上,对于每一个非代表对象 , 判断它与从样本中选出的哪个代表对象最近. (4) 计算上一步中得到的聚类的总代价. 若该值小于当前的最小值,用 该值替换当前的最小值,保留在这次选样中得到的 个代表对象作 为到目前为止得到的最好的代表对象的集合. (5) 返回到步骤(1) ,开始下一个循环. (6)算法
您可能关注的文档
- 人教版新目标英语七年级上unit5__do_you_have_a_soccer_ball___section a_2a-2d人教版新目标英语七年级上册.ppt
- 人力资源规划管理流程人力源规划管理流程.doc
- 人民版 高中历史必修三 2013年 期末复习资料 易错易混知识人民版 高中历史必修三 2013年 期末复习资料 易错易混知识.ppt
- 人文社会科学论文人文社会学论文.doc
- 人力资源政策-新员工培训200708人力资源政策-新员工培训用200708.ppt
- 人型支原体阳性人型支原体性.doc
- 仁怀市中枢三小2013仁.doc
- 人力资源计划课程设计人力源计划课程设计.ppt
- 人像抠图:用vertusfluid mask滤镜对人像抠图人像抠图:用vertus fluid mask滤镜对人像抠图.doc
- 人文社科信息素养 学术规范.ppt
- 一建《机电实务》机电工程焊接技术一建《机电实务》机电工程 焊接技术.doc
- 亚急性甲状腺炎(含无痛性状腺炎简介)亚急性甲状腺炎(含无痛性甲状腺炎简介).ppt
- 一例癔症性心理问题的咨询例报告案例报告.doc
- 一看就增30分地理 专题 地壳运动规律一看就增30分地理 专题7 地壳运动规律.doc
- 一模复习时政小专题一模复时政小专题.ppt
- 一年级品德与生活下册 主做家务活 3教案 冀教版一年级品德与生活下册 主动做家务活 3教案 冀教版.doc
- 一、19世纪的音乐流派与作杰作.ppt
- 一年级数学下册 前后4教 冀教版一年级数学下册 前后4教案 冀教版.doc
- 一年级数学下册 几十几减(不退位)2教案 冀教版一年级数学下册 几十几减几(不退位)2教案 冀教版.doc
- 一年级音乐上册 秋天的歌小树叶 1教案 苏教版一年级音乐上册 秋天的歌 小树叶 1教案 苏教版.doc
文档评论(0)