《聚类分析中的距离度量》.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析中的距离度量;在做分类时常常需要估算不同样本之间的相似性度量(SimilarityMeasurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本次报告的目的就是对常用的相似性度量作一个总结。;目录;欧氏距离(EuclideanDistance);欧氏距离(续);Matlab计算欧氏距离; 曼哈顿距离(ManhattanDistance);Matlab计算曼哈顿距离;切比雪夫距离 ( Chebyshev Distance ) ;切比雪夫距离 ( 续 ) ;Matlab计算切比雪夫距离;明可夫斯基距离(Minkowski Distance);(2)明氏???离的缺点 明氏距离,包括曼哈顿距离、欧氏距离和切比雪夫距离都存在明显的缺点。   举个例子:二维样本(身高,体重),其中身高范围是150~190,体重范围是50~60,有三个样本:a(180,50),b(190,50),c(180,60)。那么a与b之间的明氏距离(无论是曼哈顿距离、欧氏距离或切比雪夫距离)等于a与c之间的明氏距离,但是身高的10cm真的等价于体重的10kg么?因此用明氏距离来衡量这些样本间的相似度很有问题。 简单说来,明氏距离的缺点主要有两个: (1)将各个分量的量纲(scale),也就是“单位”当作相同的看待了。 (2)没有考虑各个分量的分布(期望,方差等)可能是不同的。;Matlab计算明氏距离;标准化欧氏距离 (Standardized Euclidean distance );标准化欧氏距离(续);马氏距离(Mahalanobis Distance);(2)马氏距离的优缺点:量纲无关,排除变量之间的相关性的干扰。 (3)Matlab计算(1 2),( 1 3),( 2 2),( 3 1)两两之间的马氏距离 X = [1 2; 1 3; 2 2; 3 1] Y = pdist(X,mahalanobis) 结果: Y= 2.3452 2.0000 2.3452 1.2247 2.4495 1.2247 ; 夹角余弦(Cosine);夹角余弦(续); 汉明距离(Hamming Distance); 杰卡德相似系数(Jaccardsimilarity coefficient); 杰卡德相似系数(续);Matlab计算杰卡德距离;相关系数( Correlation coefficient ) 与 相关距离(Correlation distance);(3)Matlab计算(1, 2 ,3 ,4 )与( 3 ,8 ,7 ,6 )之间的相关系数与相关距离 X = [1 2 3 4 ; 3 8 7 6] C = corrcoef( X ) %将返回相关系数矩阵 D = pdist( X , correlation) 结果: C= 1.0000 0.4781 0.4781 1.0000 D= 0.5219 其中0.4781就是相关系数,0.5219是相关距离。;信息熵(Information Entropy)

文档评论(0)

tangdequan1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档