机器学习斯坦福大学讲义介绍.docxVIP

下载本文档

11
0
约1.96万字
约 60页
2017-05-17 发布于湖北
举报
版权申诉

机器学习斯坦福大学讲义介绍.docx

1、本文档共60页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习——斯坦福大学讲义第一课机器学习的动机与应用工具：需正版：Matlab，免费：Octave?定义（Arthur Samuel 1959）：在不直接针对问题进行编程的情况下，赋予计算机学习能力的研究领域。例：Arthur的下棋程序，计算走每一步获胜的概率，最终打败程序作者本人。（感觉使用决策树思想）定义2（Tom Mitchell 1998）：一个合理的学习问题应该这样定义：对一个计算机程序来说，给它一个任务T和一个性能测量方法P，如果在经验E的影响下，P对T的测量结果得到了改进，那么就说改程序从E中学习了。如上例：E：程序不断和自己下棋的经历，T：下棋，P：和人类选手对弈的胜率?课程的四大部分：1、?有监督学习（1）??????回归问题例：收集某地房屋价格统计、房屋大小和价格对应情况：画出一条拟合曲线，就可以通过房屋大小估计价格。-??????????有监督学习即给出一个数据集（正确的房屋价格及对应大小）-??????????此例为回归问题。回归意味着需要预测的变量是连续的（2）???????分类问题分类问题中需要处理的变量是离散的例：判断肿瘤是恶性还是两性-??????????收集肿瘤大小和恶性/良性数据，大小为横轴，是否是恶性为纵轴（只有0,1）画图-??????????肿瘤可能由多个因素导致，引入年龄，大小为横轴，年龄为纵轴，恶性以叉表示，良性以圆圈表示画图，分析患肿瘤的区域-??????????还可引入更多属性，画在多维空间中-??????????无限维空间如何处理？将无限维映射到内存的算法？2、?学习理论学习理论即解释学习型算法有效的原因（学习算法的理论基础）寻找什么样的算法能很好地近似不同的函数，训练集的规模是否合适3、?无监督学习例：如上述肿瘤例子，图中的点不知道正确答案，而是由你从中找去一定的结构，即聚类。应用于生物基因工程，图像处理，计算机视觉等领域例：鸡尾酒会问题在嘈杂的鸡尾酒会中，将你感兴趣的声音提取出来运用两个不同位置的麦克分开来自不同位置的声音还能应用于文本处理等领域使用ICA算法，Matlab一行代码即可解决4、?强化学习通过决策产生的结论或对或错，故产生一系列的决策。例：对一个模型飞机编写一个起飞程序，飞机在程序做了一连串错误决策是才会坠毁，只要做出连续的整体还不错的决策，即可保持飞机正常飞行?强化学习的基本概念：回报函数（正反馈及负反馈），程序做出正确决策时给出正反馈，反之亦然。程序不断做出决策，在不断尝试获得尽量多的正反馈时，逐渐学习并做出正确决策关键在于要定义什么是正确决策，什么是错误决策，再设计算法获取尽量多的正反馈第二课监督学习应用与梯度下降本课内容：1、??线性回归2、??梯度下降3、??正规方程组?（复习）监督学习：告诉算法每个样本的正确答案，学习后的算法对新的输入也能输入正确的答案1、?线性回归例：Alvin汽车，先让人开车，Alvin摄像头观看（训练），而后实现自动驾驶。本质是一个回归问题，汽车尝试预测行驶方向。?例：上一节课的房屋大小与价格数据集?引入通用符号：m =?训练样本数x =?输入变量（特征）y =?输出变量（目标变量）(x,y) –?一个样本?–第i个训练样本?=?本例中：m：数据个数，x：房屋大小，y：价格?监督学习过程：1)???????将训练样本提供给学习算法2)???????算法生成一个输出函数（一般用h表示，成为假设）3)???????这个函数接收输入，输出结果。（本例中为，接收房屋面积，输出房价）将x映射到y。如下图所示：???对假设进行线性表示：?通常来说，回归问题有多个输入特征。如上例中，我们还已知房屋的卧室数，即有个第二个特征。即表示大小，表示卧室数，则可将假设写成：?。为了将公式写整洁，定义，则h可写成：n =?特征数目，?：参数。选择的目的，是使h(x)与y的平方差尽量小。又由于有m个训练样本，需要计算每个样本的平方差，最后为了简化结果乘以1/2，即：我们要做的就是求：min(J())求min(J())方法：梯度下降和正规方程组?2、?梯度下降梯度下降是一种搜索算法，基本思想：先给出参数向量一个初始值，比如0向量；不断改变，使得J()不断缩小。改变?的方法：梯度下降如图所示，水平坐标轴表示，垂直坐标表示J()?一开始选择0向量作为初始值，假设该三维图为一个三维地表，0向量的点位于一座“山”上。梯度下降的方法是，你环视一周，寻找下降最快的路径，即为梯度的方向，每次下降一小步，再环视四周，继续下降，以此类推。结果到达一个局部最小值，如下图：?当然，若初始点不同，则结果可能为另一个完全不同的局部最小值，如下：表明梯度下降的结果依赖于参数初始值。?梯度下降算法的数学表示：?为赋值运算符，即表示程序中的的赋值语句。每一次将减去对求偏导的结果，即沿