机器学习中常用的距离公式.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习中常用的距离公式

机器学习中常用的距离公式 Spark大数据博客 - 机器学习中常用的距离公式 在计算机人工智能领域,距离(distance)、相似度(similarity)是经常出现的基本概念,它们在自然 语言处理、计算机视觉等子领域有重要的应用,而这些概念又大多源于数学领域的度量(metric)、 测度(measure)等概念。 曼哈顿距离 曼哈顿距离又称计程车几何距离或方格线距离,是由十九世纪的赫尔曼·闵可夫斯基所创词汇 , 为欧几里得几何度量空间的几何学之用语,用以标明两个点上在标准坐标系上的绝对轴距之总和 。曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里得空间的固定直角坐标系上 两点所形成的线段对轴产生的投影的距离总和。例如在平面上,坐标\((x_1, y_1)\)的点\(P_1\)与坐标\((x_2, y_2)\)的点\(P_2\)的曼哈顿距离为: $$d=|x_1 -x_2| + |y_1 -y_2| $$ 等价于下面的汇总式: $$d=\sum_{i=1}^n|x_i-y_i|$$ 欧几里得距离 欧几里得度量(euclidean metric)也称欧氏距离: 在数学中,欧几里得距离或欧几里得度量是 欧几里得空间中两点间“普通”(即直线)距离。在欧几里得空间中,点\(x =(x_1,x_2,...,x_n)\)和 \(y =(y_1,y_2,...,y_n)\)之间的欧氏距离为: $$d(x,y)=\sqrt{(x_1-y_1)^2 + (x_2-y_2)^2 + ... + (x_i-y_i)^2}$$ 等价于下面的汇总式: $$d=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}$$ 切比雪夫距离 数学上,切比雪夫距离(Chebyshev distance)或是\(L_∞\)度量是向量空间中的一种度量,二 个点之间的距离定义为其各座标数值差的最大值。以\(p(x_1,y_1)\)和\(q(x_2,y_2)\)二点为例 ,其切比雪夫距离为 $$D_{Chebyshev}(p,q)=max(|x_2-x_1|,|y_2-y_1|)$$ 一般形式为: $$D_{Chebyshev}(p,q)=\max_{i}(|p_i-q_i|)=\lim_{k \to \infty}(\sum_{i=1}^n|p_i- q_i|^k)^{1/k}$$ 闵可夫斯基距离 闵可夫斯基距离或闵氏距离(Minkowski Distance): 以俄罗斯数学家闵可夫斯基命名的距离;是欧式距离的推广,闵氏距离不是一种距离,而是一组 距离的定义。其定义如下: 1 / 4 机器学习中常用的距离公式 Spark大数据博客 - $$d=\sqrt[p]{\sum_{i=1}^n|x_i-y_i|^p}$$ 从上面公式可以看出: 当\(p=1\)时,就是曼哈顿距离 当\(p=2\)时,就是欧氏距离 当\(p→∞\)时,就是切比雪夫距离 马氏距离 马氏距离(Mahalanobis distance): 由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出,表示 数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是 它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两 者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度,如果协方差矩阵为单位 矩阵,马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,其也可称为正规化的马氏距离。 计算公式如下: 对于一个均值为\(\mu=(\mu_1,\mu_2,\mu_3,...\mu_p)^T\) ,协方差矩阵为\(Σ\) ,其马氏距离为: $$D_M(x)=\sqrt{( x-\mu)^TΣ^{-1}( x- \mu)}$$ 马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为\(Σ\) 的随机变量 \(\vec x\)与\(\vec y\)的差异程度: $$d(\vec x,\vec y)=\sqrt{(\vec x-\vec y)^TΣ^{-1}(\vec x-\vec y)}$$ 汉明距离 在信息论中,两个

文档评论(0)

laolao123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档