距离与相似度.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

距离与相似度——窦则胜介绍测度空间定义几种距离测度定义匹配测度相似度量测度空间d(x,y)≥0(非负性)d(x,y)=0当且仅当x=y(不可区分者的同一性)d(x,y)=d(y,x)(对称性)d(x,z)≤d(x,y)+d(y,z)(三角不等式)几种距离定义欧几里德距离

定义点

总结:X与Y的距离实质是(X-Y)的模:,计算该距离之前要标准化模式向量单位几种距离定义明可夫斯基距离

公式:

总结:L-p范数空间的距离定义,m=2:欧式距离相等,m=1:曼哈顿距离,m为无穷大:切比雪夫距离几种距离定义曼哈顿距离

切比雪夫距离

Camberra距离(Lance距离,Williams距离)几种距离定义JffreysMatusita距离几种距离定义马氏距离(Mahalanobis)

定义多变量向量,其均值为,协方差矩阵为

定义服从同一分布,且协方差矩阵为的随机变量,则差异度:

容易证明,马氏距离对一切非奇异线性变换都是不变的,这说明它不受特征量纲选择的影响。匹配测度特指二元向量的相似性测度

p:两个物体都为1的变量个数

q:i物体为1,j物体为0的变量个数

r:i物体为0,j物体为1的变量个数

s:两个物体都为0的变量个数

t:t=p+q+r+s,所有变量的个数匹配测度简单匹配距离

对应的相似度函数

Jaccard系数(Tanimoto系数)匹配测度Dice系数匹配测度汉明距离

定义:汉明距离用于信息论中,它对应的是两个等长的字符串在相同位置上不同字符的个数。汉明重量是指一个字符串相对于与它等长的零字符串的汉明距离。

汉明距离是在信息误差检测和矫正码领域提出来的。

信号距离:在数据传输过程中信号数据位发生翻转的次数;

编辑距离(Levenshtein):两个字符之间有一个转成另一个所用的最少的编辑操作次数,操作包括:替换、插入、删除一个字符匹配测度其它匹配距离定义方法

Rao测度Kulzinsky系数

等等相似度量余弦相似度函数

该函数反映了两个向量之间夹角的余弦值,对放大和缩小相对变换无影响。一般在使用前需要对个元素进行无量纲化处理。相似度量皮尔逊相关系数(Pearsoncorrelationcoefficient)

相关系数是中心化的夹角余弦相似度量指数相关系数

为相应分量的协方差,n为矢量维数,不受量纲变化的影响相似度量Tanimoto测度

Tanimoto测度两个模式的共有特征和共占有特征的比。广义Jaccard系数,在二元属性下归约为Jaccard系数。相似度量广义Dice系数法

Dice系数的广义应用推广,与夹角余弦有相似之处,分母分别是两个向量长度的算术平均值与几何平均值。相似度量直方图间的相似性

距离是最常用的直方图之间的距离。相似度量当各特征值非负时,还可见到下列几种相似系数。*****

文档评论(0)

135****6994 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档