系统工程第6讲系统模型化之聚类范例.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
选择凝聚点和确定初始分类 凝聚点就是一批有代表性的点,是欲形成类的中心。凝聚点的 选择直接决定初始分类,对分类结果也有很大的影响,由于凝聚点 的不同选择,其最终分类结果也将出现不同。故选择时要慎重.通 常选择凝聚点的方法有: (1) 人为选择,当人们对所欲分类的问题有一定了解时,根据经验,预先确定分类个数和初始分类,并从每一类中选择一个有代表性的样品作为凝聚点。 (2) 重心法 将数据人为地分为A类,计算每一类的重心,将重心作为凝聚点。 (3) 密度法 以某个正数d为半径,以每个样品为球心,落在这个球内的样品数(不包括作为球心的样品)称为这个样品的密度。计算所有样品点的密度后,首先选择密度最大的样品为第一凝聚点。然后选出密度次大的样品点,若它与第一个凝 聚点的距离大于2d ,则将其作为第二个凝聚点;否则舍去这点。这样,按密度由大到小依次考察,直至全部样品考查完毕为止.此方法中,d要给得合适,太大了使凝聚点个数太 少,太小了使凝聚点个数太多。 (4) 人为地选择一正数d,首先以所有样品的均值作为第一凝聚点。然后依次考察每个样品,若某样品与已选定的凝聚点的距 离均大于d,该样品作为新的凝聚点,否则考察下一个样品。 第一,选择凝聚点; 第二,初始分类; 对于取定的凝聚点,视每个凝聚点为一类,将每个样品根据定义的距离向最近的凝聚点归类。 第三,修改分类 得到初始分类,计算各类的重心,以这些重心作为新的凝聚点,重新进行分类,重复步骤2,3,直到分类的结果与上一步的分类结果相同,表明分类已经合理为止。 动态聚类法的基本步骤: 例1:某商店5位售货员的销售量和教育程度如下表: 售货员 1 2 3 4 5 销售量(千件) 1 1 6 8 8 教育程度 1 2 3 2 0 对这5位售货员分类。 选择凝聚点 1 ② ③  ④ ⑤ ① ② ③ ④ 为最大。可选择2和5作为凝聚点。 计算各样品点两两之间的距离,得到如下的距离矩阵 对于取定的凝聚点,视每个凝聚点为一类,将每个样品根据定义的距离,向最近的凝聚点归类。 1 ②G1 ⑤G2 1 3 4 得到初始分类为: : : 2.初始分类 计算G1和G2的重心:G1的重心(1,1.5), G2的重心(7.33,1.67) G1 G2 1 2 3 4 5 得到分类结果: : : 3.修改分类 以这两个重心点作为凝聚点,再按最小距离原则重新聚类 修改前后所分的类相同,故可停止修改。 和 。 5个售货员可分为两类 * * * * 五、类平均法(Average) 定义两类之间的距离平方为这两类元素两两之间距离平方的平均 ? ? ? ? ? p q 将p和q合并为k,则k类的样品个数为 设聚类到某一步,类p与 q分别有样品 、 个, k类与任一类 r 的距离为 六、差平方和法(Ward法 ) 反映样品之间的差异程度 设变量X的n个样品观察值为: n个样品的离差平方和为: ? ? ? ? ? ? ? ? ? ? ? q ? ? ? ? ? ? ? ? ? ? ? ? ? p k 设类p和q分别含有np、nq个样品,其离差平方和分别记为 和 直观上容易想到把两群样品聚为一大群,大群的离差平方和将超过原来两个群的离差平方和之和。 如果将p和q并类得到新类k,则类k的离差平方和为 把增加的量记为 定义类p和q之间的距离为: 设类p和q分别含有np、nq个样品,其离差平方和分别记为 和 可以推得新类 k与任一类 r 的距离:   ②   ③   ④   ⑤ ① ② ③ ④ 6.5 52 130 136 44.5 110.5 122.5 18 20 2 计算5个样品两两之间的距离 记为距离矩阵 (采用欧氏距离), 2. 合并距离最小的两类为新类,按顺序定为第6类。  ⑥= 例 离差平方和法(Ward法) 两样品间的距离的平方恰为它们之间欧氏距离平方的一半。 3、计算新类⑥与各当前类的距离, 得距离矩阵如下:  ②   ③    ⑥ ① ② ③  6.5

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档