- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一课 课程导言
1.1 导言
大纲
涵盖由浅入深的一系列机器学习技术
将会学到:
PCA, MDS, K-mean, 基于频谱的聚类方法,贝叶斯分类,boosting, logistic回归,决策树,EM算法,隐马尔可夫模型,卡尔曼滤波……
讲述算法、理论、应用背后的故事
将会既有趣又辛苦
时间安排
03.04 介绍
03.11 分类
03.18 聚类
03.25 隐马尔可夫与卡尔曼滤波
原则
简即美
在理论性和应用性上达到平衡
先修课程
概率论
分布、密度、边界……
统计基础
矩、经典分布、回归……
算法
动态规划、基本数据结构、复杂度……
编程
C/C++, Java, Matlab……
将会提供一些背景知识,但课程步调还是会比较快
处理抽象数学概念的能力
参考书
\o /~tom/mlbook.htmlMachine Learning
by Tom Mitchell
\o /~stork/DHS.htmlPattern Classsification (2supnd/sup Edition)
by Duda, Hart and Stork
\o /~mackay/itila/Information Theory, Inference, and Learning Algorithm
by David MacKay
Statistical Inference
by George Casella and Roger L. Berger
\o /en-us/um/people/cmbishop/prml/Pattern Recogniation and Machine Learning
Christopher M.Bishop
And more …
以上均为可选参考书目,每人都会有自己的学习方法
网络资源
\o /home/zhx/csmath//home/zhx/csmath/
享受之!
机器学习在科学、工作及其它领域正变得无所不在
本课程将提供应用机器学习、开发新方法的基础
1.2 机器学习单元概况
Call for editing
1.3 什么是机器学习?
大纲
背景
什么是机器学习
机器学习对于计算机科学和技术有何帮助
当今计算机科学的最大挑战
数据,数据,数据……
需要大量乏味的重复的工作才能创建数字化的世界
需要寻找新的交互方式,创造新类型的媒体
花费高的代价才能请专家(科学家、工程师、电影制作人员、图形设计师、优秀艺术家和游戏设计人员)来完成工作
需要高效地处理已经存在的数据,并通过它们获得新的数据
计算机是高效运行的机器
各种图像、场景,只要人能够创造,就可以利用计算机来得到它
但是如何来创造这些图像、场景
完全过程化合成VS完全数据化
为电影中的一个角色创造动作
完全过程化合成
动作比较连贯,但是很容易让人觉得是伪造的,很少在实际中这样用
完全手工制作或者完全数据化
效果质量很高,但是连贯性不好
把两者结合起来的混合方法或许是最好的!?
贝叶斯推理
关于不确定性的一个规则模型
非结构化数据的通用模型
数据拟合和不确定分析的有效算法
但是,当前它通常被当做一个黑盒来使用
确定性 VS 几率性
数据驱动模型
什么是机器学习
机器学习 != 人工智能
Mitchell在1997年定义的:机器学习乃于某类任务兼性能度量的经验中学习之程序;若其作用于任务,可由度量知其于已知经验中获益。
Hertzmann在2003年的评论:对于计算机图形学上的一些应用,机器学习应该被看作处理数据的一系列技术。给定一些数据,可以得到一个方法模型用于生产新的数据。
编制学习系统不只是用来解决一个问题,而是基于一些特征来使系统本身更加优化:
关于系统应该如何做出响应的一些例子
关于系统在解决问题的过程中反复试验学习到的经验
不同于通常的计算机科学,去实现一个未知的功能;仅仅是处理已知的输入输出数据对(学习过程中的训练例子)
学习问题的主要分类
学习情景根据训练例子中提供的有效信息的改变而改变
监督的:需要正确的输出
分类:输入N个目标,输出结果为选择其中一个(语音识别、目标辨认、医学诊断)
回归:输出准确值(预测未来的市场价格、温度)
部分监督的:只输出一部分有效结果
无监督的:没有反馈,需要对输出进行自我评估
聚类:聚类是指将数据分割成连贯的群集的技术
结构异常识别:检测超出正常范围的数据点
加强的:标量反馈,可能暂时推迟
更多信息
时间序列分析
降维
模型选择
泛型方法
图形建模
为什么要学习机器学习?
开发强化的计算机系统
能够自动适应用户,更加符合用户要求
旧的系统往往很难获得必要的知识
发掘大型数据库中离线的新数据挖掘模式
提高对人的认识,生物学习
提供具体的理论计算分析,预测
分析大脑的学习过程中的爆发式活
文档评论(0)