机器学习中的数学基础(1)——向量与范数.docxVIP

机器学习中的数学基础(1)——向量与范数.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从今天开始,我将开设一个机器学习数学基础的系列。主要介绍机器学习中经常用到的那些数学知识,方便大家入门。一说起数学,有人会觉得很难。其实在这个系列中,我将会以最直白的语言来向你解释这些数学名词,大家不用担心,即使你是零基础,一样可以看得懂。 向量 我们从向量开始说起,什么是向量?它其实就是用括号括起来的一堆数,只不过这些数都是竖着写的。比如: 它们就分别是1维、2维和3维的向量。我们一般用小写粗体来表示向量,如x。如果我们写 它代表什么含义呢?“∈”这个符号读作属于,R表示实数集,而n表示维度。也就是说向量有几个元素,就是几维的向量。整个式子表示:向量x有n个维度,每个元素的取值都在实数集中。 范数 范数,又叫做L-p范数。它是这么定义的: 看上去很复杂,其实也容易理解,我们一点点来看。上面的式子是说,对于给定的一个n维向量w,它的范数就是向量w中的各个元素的绝对值的p次方之和,再开p次的根号(1/p就相当于开p次根号)。根据p的取值不同,范数的结果也就不同。我们常用的p值为12,∞等等。 1. L1范数 我们先来看p值为1时的范数,我们称之为L1范数。把p=1代入上面的式子,得到: 可能上面的式子还不够直观,我们再举个例子来看。假设我们有二维向量w=(x,y),那么w的L1范数就是|x|+|y|。当范数值固定时,我们还可以画出由所有的点(x,y)构成的图像。这里不妨假设|x|+|y|=1(当然你可以假设为任意值k,这里假设为1只是为了画图方便),我们大概用手画一下它的图像: 图1 那么图像为什么是这样子的呢?我们可以研究下公式|x|+|y|=1,其中x和y的正负性是未知的,我们就可以分情况来讨论: ① x0,y0。公式化简为x+y=1,它原本的图像是过图1中A、B两点的直线,但现在约束条件是x、y均大于0.所以它最后的图像就是AB线段。 ② x0,y0。公式化简为x-y=1,它原本的图像是过图1中A、D两点的直线。但现在有了约束条件,所以它最后的图像就是AD线段。 ③ x0,y0。公式化简为-x+y=1,它原本的图像是过图1中B、C两点的直线。但在约束条件下,它最后的图像为BC线段。 ④ x0,y0。公式化简为-x-y=1,它原本的图像是过图1中C、D两点的直线。但在约束条件下,它最后的图像变成CD线段。 综合以上的4种情况,|x|+|y|=1最后的图像就是由AB、AD、BC、CD一共4条线段构成。 另外,我们也把L1范数称为曼哈顿距离。为什么呢,我们画个图来看下: 曼哈顿街道(图2) 美国曼哈顿的街道一般都是横平竖直的,从上图中可以看出,我们想从A点到B点,无论我们如何选择路线行走,最后走过的距离都是x+y。 2. L2范数 当p值为2时,代入范数定义公式,可得到L2范数: 注意,L2范数右下角的小标2是可以省略的,也只有L2范数才能省略。我们还是用向量w=(x,y)来举例说明,则上式为: 这里我们不妨再假设w的范数值为1,则有x2+y2=1.这就是单位圆的方程啊,我们把它画出来: 图3 此外,L2范数也被叫做欧式距离。 3. L-∞范数 当p的值取无穷大时,此时的范数又是多少呢?我们一步一步来推导,先把p=∞代入,得到: 展开,可得 我们先来关注括号内的部分,对于W1到Wn,我们总能找到一个Wj,使得Wj在其中是最大值。由于指数增长是非常快的,那么在求它们的∞次方的时候,括号内的值可以被看做是求Wj的∞次方。然后再对它开∞次的根号,最后得到的就是|Wj|。因此,我们就得到: 其中,Wj是向量w元素中的最大值。我们还是以向量w=(x,y)举例,来画出L-∞范数下的图像: 可以看到,最后的图像是一个正方形。那为什么是这样呢?我们还是分情况来讨论: ① x取到最大值k,且x0。也就是说x=k,那么图像就是AB线段。 ② x取到最大值k,且x0。结果是x=-k,那么图像就是CD线段。 ③ y取到最大值k,且y0。则y=k,图像是BC线段。 ④ y取到最大值k,且y0。则y=-k,图像为DA线段。 综合以上4种情况,最后的图像就是一个ABCD所构成的正方形了。 以上的内容,你都明白了吗?有问题可以私信我。

文档评论(0)

jyr0221 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档