相似度测量之距离.docVIP

  • 5
  • 0
  • 约小于1千字
  • 约 2页
  • 2017-04-08 发布于江苏
  • 举报
相似度测量之距离

相似度测度 在模式识别中,衡量和评估模式与模式之间相似度的标准或者准则是相似度测度,包括距离和角度两个方面。 距离:不同应用环境中对向量与向量距离的广义定义 欧式距离(Euclid) 定义:欧式距离即欧几里德度量,它是被定义在欧几里德空间中。 公式: 定义点 总结:X与Y的距离实质是(X-Y)的模:,计算该距离之前要标准化模式向量单位 马氏距离(Mahalanobis) 定义:马氏距离表示数据的协方差距离,是有效计算未知样本集的相似度的方法 公式: 定义多变量向量,其均值为,协方差矩阵为 定义服从同一分布,且协方差矩阵为的随机变量,则差异度: 总结:当=1时马氏距离就是欧氏距离;马氏距离能够考虑到各个样本特征之间的相互联系且尺度无关 明氏距离(Minkowaki) 定义:明氏距离表示的是样本之间的街坊距离,如下图: 公式: 总结:当m=2是明氏距离与街坊距离相等 汉明距离(Hamming) 定义:汉明距离用于信息论中,它对应的是两个等长的字符串在相同位置上不同字符的个数。汉明重量是指一个字符串相对于与它等长的零字符串的汉明距离。 10011与11001的汉明距离是2, 10011的汉明重量是3 总结:汉明距离是在信息误差检测和矫正码领域提出来的; 信号距离:在数据传输过程中信号数据位发生翻转的次数; 编辑距离(Levenshtein):两个字符之

文档评论(0)

1亿VIP精品文档

相关文档