各种向量和矩阵的范数的意义.pptVIP

下载本文档

33
0
约4.32千字
约 45页
2019-07-01 发布于广东
举报
版权申诉

各种向量和矩阵的范数的意义.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

向量和矩阵的范数马玉玲 2017年03月08日 1 Outline 1.相关概念——学习、误差和目标函数 2.范数概念 3.向量的范数及含义 4.矩阵的范数及含义 2 Outline 1.相关概念——学习、误差和目标函数 2.范数概念 3.向量的范数及含义 4.矩阵的范数及含义 3 Basis knowledge 相关概念——学习 A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. 4 利用经验，改善执行某任务时的系统性能。 Basis knowledge 相关概念——学习 5 Basis knowledge 相关概念——学习 6 Basis knowledge 相关概念——学习备注：表来自周老师西瓜书课件 7 Basis knowledge 相关概念——学习函数y=f(x) 备注：本页ppt来自周老师西瓜书课件 8 Basis knowledge 相关概念——学习线性模型y=wTx+b 备注：表来自周老师西瓜书课件 x(1) x(2) x(3) 插值法 9 Basis knowledge 相关概念——学习备注：表来自周老师西瓜书课件 10 Basis knowledge Empirical error: Generalization error: Error parameter: Predict wrongly I(a): 1 if a=true 0 else 相关概念——误差假定数据集D The value of ε is dependant on the task 11 相关概念——目标函数一般来说，监督学习可以看做最小化下面的目标函数：误差项正则化项正则化项可以约束模型的特性。这样就可以将人对这个模型的先验知识融入到模型的学习当中。范数是正则化的常用方法 12 Outline 1.相关概念——误差和目标函数 2.范数概念 3.向量的范数及含义 4.矩阵的范数及含义 13 范数的概念范数的目的：对向量及矩阵的“大小”进行度量 14 向量的范数 X∈Rn 为一实向量，X的范式定义如下： L1-norm L2-norm L∞-norm L0范数：指向量中非0的元素的个数 X=[-1 2 -2 ] ||X||0= 3 ||X||1= 5 ||X||∞= 2 ||X||2= 3 15 范数的含义 L0范数：指向量中非0的元素的个数最小化L0范数数据稀疏的好处：存储成本低 2. 自动实现特征选择(Feature Selection) 3. 可解释性强(Interpretability) 应用：病因分析但是，L0范数很难优化求解，是一个NP-Hard问题。稀疏 16 范数的含义 L1范数： L1范数是L0范数的最优凸近似，而且它比L0范数要容易优化求解。所以L1范数被称为“稀疏规则算子”（Lasso ） taxicab Norm，也叫Manhattan Norm 稀疏编码特征选择压缩感知 17 范数的含义（续…） L2范数：又称“岭回归”（Ridge Regression），“权值衰减（weight decay）”， Euclidean Norm 最小化L2范数，可以使得X的元素值都很小，大都接近于0 18 范数的含义（L2-norm） L2范数的好处： 1.改善“过拟合（overfitting）” 欠拟合underfitting ：训练集上误差很大，即模型不能很好地拟合已有数据；关于“过拟合”：在数学上称为“病态”（ill-condition):即函数的输入改变一点点，输出却改变非常大。过拟合（overfitting）：模型很好地拟合训练数据，然而在新样本上表现却很差。 L2范数限制了参数都很小，实际上就限制了多项式各分量的影响很小，一定程度上避免了模型出现“病态”的情况。 2.利于优化 19 范数的含义（L2-norm） L2范数的好处： 1.改善“过拟合（overfitting）” 2.利于优化机器学习中有时候损失函数是非凸的，例如：神经网络。采用梯度下降之类的优化方法时，容易卡住（Stuck in），导致很差的解。非凸的损失函数加入L2范数后 20 知识扩展——稀疏性分析：模型空间限制在w的一个L-ball 中。在(w1, w2)平面上可以画出目