数据分析PPT6.1-6.2.pptVIP

  • 24
  • 0
  • 约1.42万字
  • 约 70页
  • 2016-12-04 发布于浙江
  • 举报
数据分析PPT6.1-6.2

* * 从而 其中Mk满足 * * 2.再讨论L2的最优准则 当x1,x2,…,xn为一维数据时,要求一个数c,使得 称c是x1,x2,…,xn的m中心. 当x1,x2,…,xn为p维样品时即 xi=(xi1,xi2,…,xip)T 其第k个分量的数据集是x1k,x2k,…,xnk,设它的m中心是ck,则c=(c1,c2,…,cp)T称为x1,x2,…,xn的m中心向量. * * 从而 其中ck满足 * * 当m=1时, 1中心向量为中位向量; 当m=2时, 2中心向量为均值向量; Lm快速聚类的最终聚点应是每一类的中心向量。 对于一维数据,中位数比均值有较强的稳健性,即对异常数据有较强的抗干扰性,因而,利用L1有较强的稳健性,即聚类结果受数据中异常值的影响较小. * * 例6.3 对例6.1中的13个国家可持续发展综合国力的数据,利用Lm距离快速聚类(分为4类): (1) 用绝对距离即L1; (2) 用L1.5距离 data examp6_1; input country $ x1 x2 x3@@; cards; 澳大利亚 1249.39 1273.61 1282.68 巴西 821.60 859.85 919.73 加拿大 1641.01 1591.54 1608.32 中国 1330.45 1382.68 1462.08 法国 1546.5

文档评论(0)

1亿VIP精品文档

相关文档