- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
特征选取不同对聚类结果的影响 特征选取不同对聚类结果的影响 距离测度不同,聚类结果也不同 综上可见: 讨论(续) 距离阈值T对聚类结果的影响 6、若合并的类数没有达到要求,转3。否则停止。 3、求最小元素: 4、ω8,ω5,ω2合并, ω9=(2,5,4,6) 例2.4.3:已知有20个样本,每个样本有2个特征,数据分布如下图,使用C-均值法实现样本分类(C=2)。 第三步:更新聚类中心 第四步: 第二步: 第三步:更新聚类中心 From Sergios Theodoridis K. Koutroumbas, Pattern Recognition, Academic press, 1999 pp352 Figure 11.1 From Sergios Theodoridis K. Koutroumbas, Pattern Recognition, Academic press, 1999 pp352 Figure 11.1 From Sergios Theodoridis K. Koutroumbas, Pattern Recognition, Academic press, 1999 pp352 Figure 11.1 From Sergios Theodoridis K. Koutroumbas, Pattern Recognition, Academic press, 1999 pp352 Figure 11.1 例2.4.3:如下图所示 1、设全部样本分为6类, 2、作距离矩阵D(0) 3、求最小元素: 4、把ω1,ω3合并ω7=(1,3) ω4,ω6合并ω8=(4,6) 5、作距离矩阵D(1) 3 1 9 5 8 ω6 2 6 2 5 ω5 8 4 7 ω4 4 1 ω3 3 ω2 ω5 ω4 ω3 ω2 ω1 D(0) 例2.4.3:如下图所示 1、设全部样本分为6类, 2、作距离矩阵D(0) 3、求最小元素: 4、把ω1,ω3合并ω7=(1,3) ω4,ω6合并ω8=(4,6) 5、作距离矩阵D(1) D(1) 2 2 5 ω5 4 7 ω8 3 ω2 ω8 ω2 ω7 2·4 聚类的算法 最大距离和层次聚类算法的一个共同特点是某个模式一旦划分到某一类之后,在后继的算法过程中就不改变了,而简单聚类算法中类心一旦选定后在后继算法过程中也不再改变了。因此,这些方法效果一般不会太理想。 2. 确定评估聚类质量的准则函数。 确定模式和聚类的距离测度。当采用欧氏距离时,是计算此模式和该类中心的欧氏距离;为能反映出类的模式分布结构,应采用马氏距离,设该类的均矢为 ,协方差阵为 ,则模式 和该类的 与该类均矢 的马氏距离: 距离平方为 3. 确定模式分划及聚类合并或分裂的规则。 2·4 聚类的算法——动态聚类算法要点 2·4 聚类的算法——动态聚类的基本步骤 建立初始聚类中心,进行初始聚类; 计算模式和类的距离,调整模式的类别; 计算各聚类的参数,删除、合并或分裂一些聚类; 从初始聚类开始,运用迭代算法动态地改变模式的类别和聚类的中心使准则函数取得极值或设定的参数达到设计要求时停止。 2·4 聚类的算法——动态聚类的框图 产生初始聚类中心 聚类 检验聚类合理性 待分类模式 分类结果 合理 再迭代/修改参数 不合理 如何判断不合理? ⒈ 条件及约定 设待分类的模式特征矢量集为: 类的数目C是事先取定的。 2·4 聚类的算法 2.4.3 动态聚类法——C-均值法 ⒉ 算法思想 该方法取定 C个类别和选取 C个初始聚类中心,按最小距离原则将各模式分配到 C类中的某一类,之后不断地计算类心和调整各模式的类别,最终使各模式到其判属类别中心的距离平方之和最小。 第一步:令C=2,选初始聚类中心为 6 6 2 2 2 1 1 1 0 0 特征x2 7 6 3 2 1 2 1 0 1 0 特征x1 x10 x9 x8 x7 x6 x5 x4 x3 x2 x1 样本序号 9 9 8 8 8 7 7 7 7 6 9 8 9 8 7 9 8 7 6 8 x20 x19 x18 x17 x16 x15 x14 x13 x12 x11 0 0 第二步: 0 0 0 = ) )-( ( = - 1 0 1 0 0 = ) )-( ( = - 1 0 0 0 1 = ) )-( ( = - 所以 因为 ? - - 0 ) 0 1 ( ) 0 1 ( = - = - , ? - - 所以 因为 同理 , 1 2 , 2 1 ? \ = - - ? \ = - - = = ... ... 20 6 5 20 6 5 都属于 、 、 离计算出来,判断 与第二个聚类中
您可能关注的文档
- 第二章_绿色食品产地环境选择及评价要点分析.ppt
- 第7章服务业电子商务要点分析.ppt
- 第二章_人格权法要点分析.ppt
- 第二章_审计的种类、方法和程序__(上课用)要点分析.ppt
- 第7章钢筋混凝土和预应力混凝土梁桥要点分析.ppt
- 第7章高强混凝土及配合比要点分析.ppt
- 第7章高效液相色谱要点分析.ppt
- 第二章_纸箱制造(5学时)要点分析.ppt
- 第7章工程地质勘察2要点分析.ppt
- 第二章1蛋白质化学要点分析.ppt
- 2025年新能源行业上市公司股权激励与公司客户关系管理报告.docx
- 新能源行业环保技术创新2025:责任与机遇研究报告.docx
- 2025年车路协同通信在无人驾驶领域的创新突破.docx
- 煤炭物流行业智能化设备应用现状及2025年技术发展趋势报告.docx
- 2025年残疾人职业技能培训市场分析:未来五年行业发展趋势报告.docx
- 2025年拼多多新零售O2O增长模式研究报告.docx
- 2025年新能源汽车充电APP与能源互联网研究报告.docx
- 2025年光伏组件包装绿色物流碳减排量核算.docx
- 2025年风电叶片气动弹性优化与风力发电系统可靠性分析报告.docx
- 中药材种植规范化模式创新研究及2025年产业升级趋势分析.docx
最近下载
- 1安全生产基础档案管理制度、2安全生产责任目标考核奖惩制度、3手残事故应急处置制度、4道路交通安全事故处理报告制度.docx VIP
- 第十章 施工放样测量.pptx VIP
- 2025年邯郸市疾病和预防控制中心人员招聘笔试备考题库及答案解析.docx VIP
- 旧房加固与改造施工方案探讨.docx VIP
- 施工测量放样培训课件.pptx VIP
- YB∕T 4001.1-2019 钢格栅板及配套件 第1部分:钢格栅板.docx VIP
- 施工测量放样(复核)记录表.xlsx VIP
- 施工放样记录表.xls VIP
- YB∕T 4858-2020 用后耐火材料回收利用技术规范.pdf
- 施工放样测量记录表(带计算程序).xls VIP
文档评论(0)