机器学习及其应用。.ppt

下载文档 降价啦

19
0
约5.12千字
约 28页
2020-06-11 发布于天津
举报
版权申诉
保障服务

机器学习及其应用。.ppt

1、本文档共28页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

机器学习及其应用黄大威 2014 年 5 月 1. 机器学习是新兴学科演化的产物 2. 机器学习的主要内容 3. 机器学习的基本方法 4. 机器学习的应用 ? 中医脉诊 ? 金融时间序列 5. 总结天下大势，合久必分，分久必合。自然哲学（前科学）数学物理化学西医中医算学历法西方中国农业工业概率统计信息时代是一个需要和产生通才的时代。机器学习是需要和培养通才的领域。信息化时代信息生物学计量经济学生物力学数量金融工程生物光子学 …… …… 数字信号处理新兴交叉学科生物物理生物化学生物统计机器学习机器学习演化及联系 ? 凡是从数据中自动分析获得规律，并利用规律对未知数据进行预测的方法都在机器学习的研究范围中。 ? 无论是获得规律，还是利用规律做预测，主要对象是随机现象，因此统计方法是机器学习的主要工具。然而，作为交叉学科，与信息论，计算机科学及它们衍生的应用学科都有关联；作为研究和使用规律的学科，机器学习比这些应用学科研究对象 ( 如数据挖掘 ) 更广。 ? 反过来，由于信息及计算机科学与应用方面的参与，机器学习也创造了很多新方法，促进了统计的发展。概率论统计信息论数字信号处理通讯 …… 计算机科学神经元网络人工智能数据挖掘机器学习统计机器学习：实践与理论的互动循环 ? 抽象思维的演绎能力使人类得以构建理论王国。她是有用的，在信息时代也是客观存在的。建于 0-1 逻辑及存储基础上的计算机就是一个严格的理论世界。各种软件都是基于 0-1 逻辑基础上演绎出来的。 ? 演绎的结果是否正确，取决于前提假设。正确的假设只能从实际中归纳出来。假设是否正确，可由她演绎出来的结果与实际是否相符来检验。 ? 机器学习既能帮我们从数据中归纳出假设（无监督学习），也能帮我们在数据和假设的基础上演绎出数学模型来（有监督学习）。同时，她在建模的过程中就强调验证，用验证来选择模型。模型最终是否正确，还要新数据来检验。演绎概率论统计归纳数据假设数学模型验证机器学习仍旧需要假设，但它又时时对所做假设抱有怀疑态度，在建模中就不断用数据检验，最终以是否符合新的数据为标准。机器学习大观无监督学习有监督学习数字信号处理生物信息学计量经济学 …… 增强学习数据展示画图聚类 (cluster) 主元素分析 …… 我们教机器学习机器帮我们学习回归与分类 (classification) 最小二乘， k 近邻法岭回归， Lasso 交叉验证， Bootstrap 树状图， AdaBoost 随机森林神经元网络 …… 考虑效果与控制规划方法介绍 1 ：最小二乘与 K 近邻法 ? 最小二乘源于统计，是线性模型在高斯白噪声情况下均方误差意义最优解，在很一般性质噪声情况下也有相容解。 ? K 近邻法源于工程，但广泛条件下它收敛于条件期望，后者是最小均方误差意义下的最优估计。 ? 两种方法均用于机器学习，优劣不可一概而论。一般而言，最小二乘适用于简单问题， K 近邻法适用于复杂问题。 Y X X X x x Y T T 1 ) ( ) ( ? ? ? 方法介绍 2 ：线性模型估计与认证 ? 传统统计主要用最小二乘做参数估计；机器学习介绍了 Ridge 及 Lasso 等收缩估计以避免过拟合，具有鲁棒性。 ? 传统统计对变量选取有大量研究，如 t- 或 F- 检验，逐步回归；较近代有 AIC ， BIC ， MDL 等。机器学习更多使用交叉认证及 Bootstrap ，但也不排除使用前述方法。交叉认证 ? 传统统计得到估计量后常研究它对真实参数的收敛性；机器学习往往不假定真实模型的存在。 ? 个人看法：应假定随尺度而变的近似模型。方法介绍 3 ：决策树 ? 在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。 ? 例子：根据属性 X 1 和 X 2 对对象 Y 分类： Y=1 超重， Y=2 正常， X 1 为饭量， X 2 为运动量。决策树超重正常正常超重实例：