机器学习的数学基础.docVIP

下载本文档

25
0
约3.38万字
约 79页
2019-08-18 发布于江西
举报
版权申诉

机器学习的数学基础.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一课课程导言 1.1 导言大纲涵盖由浅入深的一系列机器学习技术将会学到： PCA, MDS, K-mean, 基于频谱的聚类方法，贝叶斯分类，boosting, logistic回归，决策树，EM算法，隐马尔可夫模型，卡尔曼滤波…… 讲述算法、理论、应用背后的故事将会既有趣又辛苦时间安排 03.04 介绍 03.11 分类 03.18 聚类 03.25 隐马尔可夫与卡尔曼滤波原则简即美在理论性和应用性上达到平衡先修课程概率论分布、密度、边界…… 统计基础矩、经典分布、回归…… 算法动态规划、基本数据结构、复杂度…… 编程 C/C++, Java, Matlab…… 将会提供一些背景知识，但课程步调还是会比较快处理抽象数学概念的能力参考书 \o /~tom/mlbook.htmlMachine Learning by Tom Mitchell \o /~stork/DHS.htmlPattern Classsification (2supnd/sup Edition) by Duda, Hart and Stork \o /~mackay/itila/Information Theory, Inference, and Learning Algorithm by David MacKay Statistical Inference by George Casella and Roger L. Berger \o /en-us/um/people/cmbishop/prml/Pattern Recogniation and Machine Learning Christopher M.Bishop And more … 以上均为可选参考书目，每人都会有自己的学习方法网络资源 \o /home/zhx/csmath//home/zhx/csmath/ 享受之！机器学习在科学、工作及其它领域正变得无所不在本课程将提供应用机器学习、开发新方法的基础 1.2 机器学习单元概况 Call for editing 1.3 什么是机器学习？大纲背景什么是机器学习机器学习对于计算机科学和技术有何帮助当今计算机科学的最大挑战数据，数据，数据…… 需要大量乏味的重复的工作才能创建数字化的世界需要寻找新的交互方式，创造新类型的媒体花费高的代价才能请专家（科学家、工程师、电影制作人员、图形设计师、优秀艺术家和游戏设计人员）来完成工作需要高效地处理已经存在的数据，并通过它们获得新的数据计算机是高效运行的机器各种图像、场景，只要人能够创造，就可以利用计算机来得到它但是如何来创造这些图像、场景完全过程化合成VS完全数据化为电影中的一个角色创造动作完全过程化合成动作比较连贯，但是很容易让人觉得是伪造的，很少在实际中这样用完全手工制作或者完全数据化效果质量很高，但是连贯性不好把两者结合起来的混合方法或许是最好的！？贝叶斯推理关于不确定性的一个规则模型非结构化数据的通用模型数据拟合和不确定分析的有效算法但是，当前它通常被当做一个黑盒来使用确定性 VS 几率性数据驱动模型什么是机器学习机器学习 != 人工智能 Mitchell在1997年定义的：机器学习乃于某类任务兼性能度量的经验中学习之程序；若其作用于任务，可由度量知其于已知经验中获益。 Hertzmann在2003年的评论：对于计算机图形学上的一些应用，机器学习应该被看作处理数据的一系列技术。给定一些数据，可以得到一个方法模型用于生产新的数据。编制学习系统不只是用来解决一个问题，而是基于一些特征来使系统本身更加优化：关于系统应该如何做出响应的一些例子关于系统在解决问题的过程中反复试验学习到的经验不同于通常的计算机科学，去实现一个未知的功能；仅仅是处理已知的输入输出数据对（学习过程中的训练例子）学习问题的主要分类学习情景根据训练例子中提供的有效信息的改变而改变监督的：需要正确的输出分类：输入N个目标，输出结果为选择其中一个（语音识别、目标辨认、医学诊断）回归：输出准确值（预测未来的市场价格、温度）部分监督的：只输出一部分有效结果无监督的：没有反馈，需要对输出进行自我评估聚类：聚类是指将数据分割成连贯的群集的技术结构异常识别：检测超出正常范围的数据点加强的:标量反馈,可能暂时推迟更多信息时间序列分析降维模型选择泛型方法图形建模为什么要学习机器学习？开发强化的计算机系统能够自动适应用户，更加符合用户要求旧的系统往往很难获得必要的知识发掘大型数据库中离线的新数据挖掘模式提高对人的认识，生物学习提供具体的理论计算分析，预测分析大脑的学习过程中的爆发式活