01-绪论概述.ppt

下载文档 降价啦

3
0
约9.69千字
约 44页
2016-12-02 发布于湖北
举报
版权申诉
保障服务

01-绪论概述.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Independent variable (x) Dependent variable (y) y’ = b0 + b1X ± ? b0 (y intercept) B1 = slope = ?y/ ?x ? 最小二乘方法概率密度估计问题：根据训练样本确定x的概率分布 p(x,w)，则损失函数可定义为: 1.3 几种学习问题最大似然估计第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价有监督/无监督学习有监督(Supervised)：分类、回归无监督(Unsupervised)：概率密度估计、聚类、降维半监督(Semi-supervised)：EM、Co-training 其他学习方法强化学习(Reinforcement Learning) 多任务学习(Multi-task learning) 1.3 几种学习问题第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价 1.4 学习算法的评价 Occams razor 树后面有多少个盒子？第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价 1.4 学习算法的评价 Blue: Observed data Red: Predicted curve Green: true distribution 第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价 1.4 学习算法的评价 William of Occham (1285–1348) from wikipedia Occams razor: Entities should not be multiplied unnecessarily —— the explanation of any phenomenon should make as few assumptions as possible, eliminating, or shaving off, those that make no difference in the observable predictions of the explanatory hypothesis or theory. 第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价 1.4 学习算法的评价最小描述长度MDL（minimum description length）源自数据压缩/最优编码可译变长编码：越频繁的信息码长越短平均信息长度越短消息的长度与事件 zi 的概率之间的关系为：为了传递具有概率密度为的随机变量 zi ，需要大约位平均信息长度第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价 1.4 学习算法的评价假设我们有以θ为参数的模型M，和包含输入输出数据Z=(X, y)，则传递输出的消息长度为：用于传递模型与目标差别所需要的消息长度传递模型参数所需的消息长度选择最小长度的模型等价于选择最大后验概率的模型第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价使模型的算法复杂度，以及与该模型相适应的训练数据的描述长度之和最小。 1.4 学习算法的评价预测精度分析第一章绪论 1.1 机器学习的发展与应用 1.2 机器学习问题的统一表达 1.3 几种学习问题 1.4 学习算法的评价 1.4 学习算法的评价当样本足够多时，可以将数据分成三份训练集：估计模型的参数校验集：估计模型的预测误差(Validation set is like your test set. You use it to select your algorithm or model.) 测试集：被测试(Test data is your future data. Put it away as far as possible don’t look at it.) 但通常没有足够多