- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
模式识别与智能计算第九章聚类分析杨淑莹天津理工大学计算机科学与工程学院
第九章聚类分析篇9.4动态聚类算法9.5模拟退火聚类算法
9.4动态聚类算法动态聚类算法:选择若干样品作为聚类中心,再按照某种聚类准则,如最小距离准则,将其余样品归入最近的中心,得到初始分类。然后判断初始分类是否合理,若不合理则按照特定规则重新修改不合理的分类,如此反复迭代,直到分类合理。
K均值算法的目标是使聚类域中所有样品到聚类中心距离的平方和最小。其原理为:先取k个初始聚类中心,计算每个样品到这k个中心的距离,找出最小距离把样品归入最近的聚类中心,如图9-7(a)所示,修改中心点的值为本类所有样品的均值,再计算各个样品到k个中心的距离,重新归类、修改新的中心点,如图9-7(b)所示。直到新的聚类中心等于上一次的中心点时结束。9.4.1K均值算法图9-7K均值算法示意图
实现步骤①通过对话框读取计算距离的方法以及需要分类数目centerNum和最大迭代次数iterNum。
②随机取centerNum个样品作为聚类中心。其余样品中心号为-1,样品到本类中心的距离为max(max为无穷大)。实现步骤
实现步骤③计算其余样品到所有类中心的距离,将它们归为距离最近的类,至此,所有的样品都归类完毕。然后计算各个类中心所有样品特征值的平均值作为该聚类中心的特征值。④对每一类中的各个样品,计算它到其他类中心的距离,如果它到某一类中心的距离小于它到自身类中心的距离,需要对该样品重新分类,将它归属到距离中心近的类,循环重复所有的样品,直至不再有样品类号发生变化。
实现步骤代码实现:
9.4.1迭代自组织的数据分析算法此算法与K均值算法有相似之处,即聚类中心也是通过样品均值的迭代运算来决定的。但ISODATA加入了一些试探性的步骤,能吸取中间结果所得到的经验,在迭代过程中可以将一类一分为二(分裂),也可以将两类合并,即“自组织”。这种算法具有启发性,会在计算过程中不断地调整类中心的个数,直到使分类的总的样品方差最小。实现步骤:①输入阈值T,方差equation,类中心数目centerNum,最大迭代次数iterNum
实现步骤②任意选取precenterNum个(不妨取前centerNum个)样品作为聚类中心m_center(i)m。③求各个样品到所有聚类中心的距离,将所有样品归入最近的类中心。④修正各聚类中心的值。⑤计算各聚类域中诸样品到聚类中心间的平均距离。⑥计算所有聚类域样品平均距离的总平均距离。
实现步骤?
实现步骤?⑩如果是最后一次迭代(即第iterNum次迭代)则结束循环。否则循环继续第④步,迭代次数加1。
9.5模拟退火聚类算法模拟退火算法其思想源于物理中固体物质退火过程与一般组合优化问题之间的相似性。物理退火过程(1)升温过程(2)等温过程(3)冷却过程升温的目的是增强物体中粒子的热运动,使其偏离平衡位置变为无序状态。升温过程与系统的熵增过程相关,系统能量随温度升高而增大。在物理学中,对于与周围环境交换热量而温度不变的封闭系统,系统状态的自发变化总是朝向自由能减小的方向进行,当自由能达到最小时,系统达到平衡态。与升温过程相反,使物体中粒子的热运动减弱并渐趋有序,系统能量随温度降低而下降,得到低能量的晶体结构。
模拟退火算法的基本原理模拟退火的基本思想是指将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温度上升变为无序状,内能E增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解和控制参数初值开始,对当前解重复“产生新解→计算目标函数差→判断是否接受→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解。
模拟退火算法的基本原理?判断是否接受如果ΔE≤0,则接受该状态被转换;如果ΔE0,则状态转换以如下概率被接受:?
模拟退火算法的基本过程?
退火方式模拟退火算法中,退火方式对算法有很大的影响。如果温度下降过慢,算法的收敛速度会大大降低。如果温度下降过快,可能会丢失极值点。比较有代表性的几种退火方式如下:?t代表当前循环次数,其特点是温度下降缓慢,算法收敛速度也较慢。?a为可调参数,可以改善退火曲线的形态。其特点是高温区温度下降较快,低温区是温度下降较慢,即主要在低温区进行寻优。?a为可调参数。其特点是温度下降较快,算法收敛速度快。
9.5.2基于模拟退火思想的改进K均值聚类算法1、K均值算法的局限性基本的K均值算法目的是找到使目标函数值最小的K个划分,算法思想简单,易实现,而
您可能关注的文档
- a1模式识别与智能计算第一章.ppt
- a2模式识别与智能计算第二章.ppt
- a3模式识别与智能计算第三章.ppt
- a4模式识别与智能计算第四章+基于统计概率的贝叶斯分类器设计.ppt
- a5模式识别与智能计算第五章+判别函数分类器设计.pptx
- a6模式识别与智能计算第六章-神经网络分类器设计.pptx
- a7模式识别与智能计算第七章+决策树.pptx
- a8模式识别与智能计算第八章+粗糙集分类器设计.pptx
- a10模式识别与智能计算第十章+模糊聚类分析.pptx
- a11模式识别与智能计算第十一章+遗传算法聚类分析.pptx
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)