统计机器学习幻灯片.pptVIP

下载本文档

33
0
约6.07千字
约 36页
2018-03-23 发布于广东
举报
版权申诉

统计机器学习幻灯片.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

近期的研究课题中国科学院自动化研究所重采样技术损失函数变量稀疏变量稀疏：变量选择---特征选择中国科学院自动化研究所模式识别：减少计算量。特征选择统计学：获得信息(相对预测),变量稀疏--变量选择数据挖掘：描述数据(相对预测)。当前任务：辨别自然模型的真实变量，过滤多余变量带来的噪音。特征选择 vs. 变量稀疏中国科学院自动化研究所特征选择 Wrapper 变量稀疏 LASSO Filter LARS 对特定算法，优化中逐步删除不必要的变量。通过逐步加入变量，完成优化。 LASSO 中国科学院自动化研究所 LASSO(Least Absolute Shrinkage and Selection Operator) [Tibshirini,1996]： ?=[?1,…,?1]p，考虑?T?j?c，将其作为线性约束，共2p个。使用最小二乘计算初始的?，使用一个迭代算法，直到???j?c。求解L1约束下平方误差损失最小的问题。所有与?j?0对应的变量，就是被选择的变量集合。 (1)在集群意义下，研究弱模型的作用。 (2)消除冗余特征，发现问题需要且仅需要的变量。两者的区别仅在不同空间上，使用LASSO。中国科学院自动化研究所改变模式识别中“特征选择的目的是减少计算量”的动机，变为发现自然模型的真实变量，其根源是“数据涌现”，这是一个对科学更为本质的动机。总结中国科学院自动化研究所人工智能决策树模式分类神经网络排他泛化统计机器学习统计学家+计算机科学家高维数据的自然涌现对统计学挑战性的问题非线性高维数据对计算机科学挑战性的问题根据重采样的集群根据问题的变量稀疏根据问题的损失函数分类? 相似谢谢中国科学院自动化研究所机器学习的研究激动人心，危机四伏，不进则退中国科学院自动化研究所 Machine Learning and Data Mining 2006 Machine Learning and Data Mining 2008 中国科学院自动化研究所统计机器学习王珏中国科学院自动化研究所第11届中国机器学习会议大连，2008，8 机器学习与人工智能中国科学院自动化研究所机器学习来源于人工智能。著作：机器学习(Machine Learning) Tom Michell 描述：如果一个系统能够通过执行某种过程而改进它的性能，这就是学习。 Herbert Simon 机器学习中国科学院自动化研究所 Vapnik在“机器学习”术语之前加了“统计”二字，变为“统计机器学习”。由此从Rosenblatt的感知机到人工神经网络划入了这个领域。 Duda Hart的模式分类(统计模式识别)划入这个领域。统计学的算法文化划入了这个领域。 Quilan的决策树方法和Valiant的PAC划入这个领域。 “统计” 人工智能与统计机器学习中国科学院自动化研究所早期，不喜欢。M.Minsky的批评，感知机停滞。 Duda Hart的统计模式识别，统计机器学习与其一致。人工神经网络反对AI。统计机器学习使用的AI成果： Valiant的PAC：这是当前统计机器学习的基础之一。 Quilan的决策树：这是统计机器学习最重要的算法之一。统计机器学习已成为人工智能最主要的研究课题。 Vapnik在“泛化”旗帜下，批判了这种排他性。统计机器学习中国科学院自动化研究所统计机器学习的理论框架有限样本理论统计建模的两种文化近期的研究课题 Duda Hart 中国科学院自动化研究所 1973年，他们出版了至今有重要影响“Pattern classification and scene analysis”，2001年，在此基础上，删除了情境分析的内容，大量增加了统计建模的内容。尽管2001年版的内容大大丰富了，无论在理论研究结果，方法的罗列，还是参考文献的收集，都可以称为一本研究者必备的手册，但是，其理论框架的识别也比1973版困难。统计机器学习的统计框架中国科学院自动化研究所 Duda Hart的模式分类理论框架=统计机器学习理论框架 Bayes决策论后验概率：P(?j?x)=P(?i)p(xj??i)。样本数趋于无穷大。判决规则：对所有?j，最大P(?j?x)就是x的类别。目标：风险R(?i?x)=??(?i??j)P(?i?x)最小。?是损失函数。函数g(x)=w0+?wtx，如果?wtx-w0，x属于?1。问题变为在确定的损失函数(准则函数或目标函数)意义