- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习中常用的距离公式
机器学习中常用的距离公式
Spark大数据博客 -
机器学习中常用的距离公式
在计算机人工智能领域,距离(distance)、相似度(similarity)是经常出现的基本概念,它们在自然
语言处理、计算机视觉等子领域有重要的应用,而这些概念又大多源于数学领域的度量(metric)、
测度(measure)等概念。
曼哈顿距离
曼哈顿距离又称计程车几何距离或方格线距离,是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,
为欧几里得几何度量空间的几何学之用语,用以标明两个点上在标准坐标系上的绝对轴距之总和
。曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里得空间的固定直角坐标系上
两点所形成的线段对轴产生的投影的距离总和。例如在平面上,坐标\((x_1,
y_1)\)的点\(P_1\)与坐标\((x_2, y_2)\)的点\(P_2\)的曼哈顿距离为:
$$d=|x_1 -x_2| + |y_1 -y_2| $$
等价于下面的汇总式:
$$d=\sum_{i=1}^n|x_i-y_i|$$
欧几里得距离
欧几里得度量(euclidean metric)也称欧氏距离: 在数学中,欧几里得距离或欧几里得度量是
欧几里得空间中两点间“普通”(即直线)距离。在欧几里得空间中,点\(x =(x_1,x_2,...,x_n)\)和
\(y =(y_1,y_2,...,y_n)\)之间的欧氏距离为:
$$d(x,y)=\sqrt{(x_1-y_1)^2 + (x_2-y_2)^2 + ... + (x_i-y_i)^2}$$
等价于下面的汇总式:
$$d=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}$$
切比雪夫距离
数学上,切比雪夫距离(Chebyshev distance)或是\(L_∞\)度量是向量空间中的一种度量,二
个点之间的距离定义为其各座标数值差的最大值。以\(p(x_1,y_1)\)和\(q(x_2,y_2)\)二点为例
,其切比雪夫距离为
$$D_{Chebyshev}(p,q)=max(|x_2-x_1|,|y_2-y_1|)$$
一般形式为:
$$D_{Chebyshev}(p,q)=\max_{i}(|p_i-q_i|)=\lim_{k \to \infty}(\sum_{i=1}^n|p_i-
q_i|^k)^{1/k}$$
闵可夫斯基距离
闵可夫斯基距离或闵氏距离(Minkowski
Distance):
以俄罗斯数学家闵可夫斯基命名的距离;是欧式距离的推广,闵氏距离不是一种距离,而是一组
距离的定义。其定义如下:
1 / 4
机器学习中常用的距离公式
Spark大数据博客 -
$$d=\sqrt[p]{\sum_{i=1}^n|x_i-y_i|^p}$$
从上面公式可以看出:
当\(p=1\)时,就是曼哈顿距离
当\(p=2\)时,就是欧氏距离
当\(p→∞\)时,就是切比雪夫距离
马氏距离
马氏距离(Mahalanobis distance): 由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出,表示
数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是
它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两
者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度,如果协方差矩阵为单位
矩阵,马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,其也可称为正规化的马氏距离。
计算公式如下:
对于一个均值为\(\mu=(\mu_1,\mu_2,\mu_3,...\mu_p)^T\) ,协方差矩阵为\(Σ\)
,其马氏距离为:
$$D_M(x)=\sqrt{( x-\mu)^TΣ^{-1}( x- \mu)}$$
马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为\(Σ\) 的随机变量 \(\vec
x\)与\(\vec y\)的差异程度:
$$d(\vec x,\vec y)=\sqrt{(\vec x-\vec y)^TΣ^{-1}(\vec x-\vec y)}$$
汉明距离
在信息论中,两个
您可能关注的文档
最近下载
- 2025年抖音本地生活服务业务深度分析报告 .pdf VIP
- 广西壮族自治区资源县农业局公务员招录事业单位招聘考试录用96人大全(含答案).docx VIP
- 清水河储能电站施工方案.doc VIP
- 2025至2030年中国美甲产业竞争现状及发展前景预测报告.docx
- 《新媒体营销》教学大纲.docx VIP
- 幼儿园小学生姓名卡片姓名贴纸.docx VIP
- 郑州市第四十七中学新初一分班(摸底)语文模拟试题(5套带答案).doc VIP
- 《边城》ppt.ppt VIP
- 2024凉山州专业技术人员继续教育公需科目-提升常态化监管水平,大力发展数字经济,支持平台经济发展试题及满分答案.docx VIP
- 口腔根尖周炎病例分析.pptx VIP
文档评论(0)