模式识别-聚类分析.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 4、算法改进的出发点 算法的性能与c及聚类中心初始值、样本顺序有关 (1)c的调整 (a)按先验知识确定c (b)让c从小到大逐步增加,每个c都用c-均值法分类,J 随c的增加而单调减少,但速度在一定时候会减缓, 曲率变化最大点对应最优类数 (2)初始聚类中心的选择 (a)凭经验 (b)将模式随机分成c类,计算每类中心,作为初始类心 (c)求以每个特征点为球心,某一正数d0为半径的球型区域中的特征点个数(即该特征点的密度),选取密度最大的特征点为第一个初始聚类中心,然后,在与该中心大于某个距离d的那些特征点中选取另一个具有最大密度的特征点作为第二个初始聚类中心,直到选取c个初始类心 (d)用相距最远的c个特征点作为类心 (用最大最小距离算法) (e)当N较大时,先随机地从N个模式中取出一部分模式用层次聚类法聚成c类,以每类的重心作为初始类心 (3)用类核代替类心 模糊C-均值算法 二、模糊C-均值算法 (1)模糊子集 (2)模糊C-均值算法(FCM算法) 将N个n维特征矢量 分成C类,分类结果用分划矩阵 表示, 表示样本 属于 类的程度,它满足 FCM算法在迭代寻优过程中,使 达到最小 式中: , 为 类的中心矢量,权重 ,V为协方差矩阵 (3)FCM算法步骤 (a)确定类别数C,参数m,矩阵V和适当小数 (b)置初始模糊分类矩阵 ,令 (c)计算 时的 : (d)按下面的方法更新 为 , 对i=1至N (i)计算 和 : (ii)计算 的新隶属度: 如果 ,则: 否则, (e)若 ,停止。否则,Goto (c) ISODATA算法 ISODATA算法--迭代自组织数据分析算法 1、条件及约定: 待分类的模式集 ,    预期的分类数;         初始聚类中心个数;    每一类中允许的最少模式数目;  类内各分量分布的标准差上限;    两类中心间的最小距离下限;   在每次迭代可合并的类的最多对数    允许的最多迭代次数    2、算法思想: 在每轮迭代过程中,样本重新调整类别之后计算类内及类间有关参数,并和设定的门限比较,确定是两类合并为一类还是一类分裂为两类,不断地“自组织”,以达到在各参数满足设计要求条件下,使各模式到其类心的距离平方和最小。 * * 合并的条件: (类内样本数 )∨(类的数目 )∧(两类间中心距离 ) 分裂的条件: (类的数目 )∧(类的某分量标准差 )∧ 这里,∨表示“或”的关系;∧表示“与”的关系。如果类的 数目 有 ,当 是奇数时分裂,当 是偶数时合并。 由上述合并与分裂的判断条件可以看出算法初设的7个参数存 在一定的相互制约。 3、算法步骤: (1)预置:设定控制参数,读入       任选 个初始类心 (2)按最小距离原则将模式集中每个模式分到某一类中 (3)依据  判断合并。如果类  中的样本数    则取消该类的中心  ,  且令       Goto (2) (4)计算分类后的参数:   (a)各类的中心:   (b)计算各类中模式到类心得平均距离:   (c)计算总体平均距离: (5)依据迭代次数 和  , 判断停止、分裂或合并   (a)若迭代次数    则置     Goto (9); 否则,继续;

文档评论(0)

yyh892289 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档