- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6.机器学习(1.概述)
* 机器学习的问题 存在什么样的算法能从特定的训练数据学习一般的目标函数呢?如果提供了充足的训练数据,什么样的条件下,会使特定的算法收敛到期望的函数?哪个算法对哪些问题和表示的性能最好? 多少训练数据是充足的?怎样找到学习到假设的置信度与训练数据的数量及提供给学习器的假设空间特性之间的一般关系? 学习器拥有的先验知识是怎样引导从样例进行泛化的过程的?当先验知识仅仅是近似正确时,它们会有帮助吗? 怎样把学习任务简化为一个或多个函数逼近问题?换一种方式,系统该试图学习哪些函数?这个过程本身能自动化吗? * * 机器学习 * 为什么学习 学习的定义 设计一个学习系统 学习的一般形式 机器学习研究的问题 OUTLINE * 为什么学习 为什么要研究机器学习? 现在的人工智能系统还完全没有或仅有很有限的学习能力。系统中的知识由人工编程送入系统,知识中的错误也不能自动改正。也就是说,现有的大多数人工智能不能自动获取和生成知识,系统性能难以改善。 未来的计算机将有自动获取知识的能力,它们直接由书本学习,通过与人谈话学习,通过观察学习。它们通过实践自我完善。 优点:存储大、效率高、易于传送所获取的知识。一台计算机获取的知识很容易复制给任何其它机器 * 为什么学习 学习的例子: 计算机能从医疗记录中学习,获取诊断疾病的方法 个人软件助理跟踪用户的兴趣,并为其选择最感兴趣的在线早间新闻 数字识别、汉字识别、语音识别 * 为什么学习 学习目的:让计算机随着经验的积累自动提高性能 * 为什么学习 学习的定义 设计一个学习系统 学习的一般形式 机器学习研究的问题 OUTLINE * 学习的定义 学习定义: 对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序从经验E中学习 对于一个学习问题,必须明确: 任务的种类T 衡量性能提高的标准P 经验的来源E * 学习问题示例 手写数字识别学习问题 任务T:识别和分类图像中的手写数字 性能标准P:分类的正确率 训练经验E:已知分类的手写数字数据库 国际象棋学习问题 任务T:下国际象棋 性能标准P:比赛中击败对手的百分比 训练经验E:和自己进行对弈 * 学习问题示例 机器人驾驶学习问题 任务T:通过视觉传感器在四车道高速公路上驾驶 性能标准P:平均无差错行驶里程 训练经验E:注视人类驾驶时录制的一系列图像和驾驶指令 * 为什么学习 学习的定义 设计一个学习系统 学习的一般形式 机器学习研究的问题 OUTLINE * 设计一个学习系统 基本设计方法和学习途径 (以西洋跳棋为例) 选择训练经验 选择目标函数 选择目标函数的表示 选择函数逼近算法(选择学习算法) 最终设计 * 第一个关键属性,训练经验能否为系统的决策提供直接或间接的反馈。E.g.西洋跳棋 系统可从直接的训练样例,即各种棋盘状态和相应的正确走子中学习 系统可能仅有间接的信息,即很多过去对弈序列和最终结局(较早走子的正确性由结局推断。面临信用分配问题:每一次走子对最终结果的贡献程度) 注意:本例中系统提供的是间接训练经验 第二个重要属性,训练样例的分布能多好地表示实例分布,最终系统的性能是通过后者来衡量的。 选择训练经验 * 西洋跳棋学习问题 任务T:下西洋跳棋 性能标准P:击败对手的百分比 训练经验E:和自己进行训练对弈 学习系统需要选择 要学习的知识的确切类型 对于这个目标知识的表示 一种学习机制 选择目标函数(1) * 学习任务:如何从合法的走子中选择最佳走子。因此,要学习的信息类型是程序或函数 目标函数ChooseMove ChooseMove: B?M,接受合法棋局集合中的棋盘状态作为输入,并从合法走子集合中选择某个走子作为输出 问题转化 我们把提高任务T的性能P的问题转化(或简化)为学习像ChooseMove这样某个特定的目标函数 选择目标函数(2) * ChooseMove的评价 学习问题很直观地转化成这个函数 这个函数的学习很困难,因为提供给系统的是间接训练经验 选择目标函数(3) * 另一个目标函数V 一个评估函数,V: B?R,它为任何给定棋局赋予一个数值评分,给好的棋局赋予较高的评分 优点,学习简单 V的应用 根据V能够轻松地找到当前棋局的最佳走法。 选择目标函数(4) * V的设计,对于集合B中的任意棋局b,V(b)定义如下 如果b是一最终的胜局,那么V(b)=100 如果b是一最终的负局,那么V(b)=-100 如果b是一最终的和局,那么V(b)=0 如果b不是最终棋局,那么V(b)=V(b’),其中b’是从b开始双方都采取最优对弈后可达到的终局 选择目标函数(5) * 上面设计的缺陷 递归定义、运算效率低 不可操作 简评 学习任务简化成发现一个理想
您可能关注的文档
- 4GDTU连接信捷PLC进行远程上传程序--有人物联网.pdf
- 4G无线通信系统的信道特性.pdf
- 4_6_O_苄叉_2_O_叔丁基_省略_基吡喃葡萄糖苷的合成及其晶体结构_姜琳琳.pdf
- 4个减肥小游戏教你玩转脂肪.pdf
- 4号主变电压互感器烧损原因分析.pdf
- 4复数的乘除运算.docx
- 4.6.3余角和补角课件.ppt
- 4GDTU连接三菱PLC型号FX1s使用透传云服务器进行远程下载上传程序--有人物联网.pdf
- 4计算机数字PID控制技术.pdf
- 4质数和合数.ppt
- 2025年家居家纺商业计划书线上线下融合下的市场拓展策略.docx
- 2025年农业绿色发展政策支持与农业循环经济发展政策优化创新优化报告.docx
- 教育精准扶贫对农村地区教育投入结构优化的影响评估报告.docx
- 医疗美容行业监管政策对美容护肤品牌的影响与2025年市场策略分析报告.docx
- 纺织服装制造行业数字化转型中的政策环境与法规解读报告.docx
- 农业科技成果转化与农村旅游开发2025年报告.docx
- 2025年城市河道生态修复项目组织管理建议书.docx
- 农村电商服务站农产品电商平台用户行为分析与产品创新报告.docx
- 医疗美容服务行业规范化背景下,2025年市场监管法规解读与应用.docx
- 航空运输业2025年疫情冲击应对策略与可持续发展研究报告.docx
文档评论(0)