第1章 引言.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1章引言概要1

* * * * * * * * * * * * * * * 选择训练经验 西洋跳棋学习问题的总结描述: 任务T:下西洋跳棋 性能标准P:世界锦标赛上击败对手的百分比 训练经验E:和自己进行对弈 为此,需要选择: 要学习知识的确切类型 对于这个目标知识的表示 学习机制 选择目标函数 可选择的走子方式产生一个巨大的搜索空间,必须从中寻找最佳走子步骤 目标函数:用以搜索最佳走子策略 目标函数ChooseMove: 输入:合法棋局集合的棋盘状态 输出:某种走子方式 不能直接实现:提供给系统的是间接的学习经验(对弈步骤及棋局结果) 选择目标函数 现实主义版的目标函数:可实现 能够为任何给定棋局赋予一个数字评分 新的目标函数:将任何合法的棋局映射为一个实数值,高分表示更好的棋局 如何实现? 反思:人是如何考虑当前的棋局形势的? 选择目标函数 x1:棋盘上黑子的数量 x2:棋盘上红子的数量 x3:棋盘上黑王的数量 x4:棋盘上红王的数量 x5:被红子威胁的黑子的数量 x6:被黑子威胁的红子的数量 实用的目标函数 目标函数V:B ? R。 V把任一合法棋局映射为一个实数 V给较好的棋局较高的评分 实现方法:先产生每一合法走子对应的所有后续棋局,然后实用V来选取其中最佳棋局,从而确定当前最佳走子 具体定义V如下。。。 目标函数V(b) 如果b是最终胜局,那么V(b)=100 如果b是最终败局,那么V(b)=-100 如果b是最终和局,那么V(b)=0 如果b不是最终棋局,那么V(b)= V(b‘),其中b’是从b开始,双方都采取最优对弈后可达到的终局 问题:由于定义的递归性,运算效率不高 实际选取V(b)的简化版本V (b)(近似目标函数,又称函数逼近) 实际目标函数的表示 查表法:根据不同的棋盘状态进行查表 规则集合:根据不同的棋盘特征设立规则 用于评价的二次多项式函数 人工神经网络 线性函数法: 选择函数逼近算法 由参变量和函数规则选择函数的表示方法:w0+w1x1+w2x2+。。。 然后使用样例进行训练,以求得函数的参数 训练可考虑使用最小均方误差:Least Mean Square,LMS 最终设计 最终设计: 执行系统(Performance System) 鉴定器(Critic) 泛化器(Generalizer) 实验生成器(Experiment Generateor) 最终设计图 实验生成器 执行系统 鉴定器 泛化器 新问题 解答路线 训练样例 假设 完整设计过程 * * * * * * * * * * * * * * * * * * * * * 第1章 引言 学习问题的标准描述 设计一个学习系统 算法新世界 算法如何塑造世界: /movie/2014/9/E/4/MA44RQGQ6_MA47DTLE4.html 机器学习编程语言选择 matlab:价格昂贵、非开源、性能平平 R:在2015年排名前十的编程语言中,R语言是提升最快的,倾向统计学 Perl:没落,目前主要用于编写简单的网络脚本 Python:老而弥坚(20年风雨),语法更容易被程序员接受 计算性能比较 慕课资源 斯坦福大学公开课 :机器学习课程 Andrew Ng: /special/opencourse/machinelearning.html 加州理工学院公开课:机器学习与数据挖掘 Yaser Abu-Mostafa: /special/opencourse/learningfromdata.html 网易云课堂 收费。。。 概念 模式:区别事物的特征的时空组合 模式识别:以事物的特征为依据识别事物 “机器”学习:机器经过学习和训练后,可以进行识别、推理、预测。 理想 计算机的自我学习能力: 从医疗记录中学习,以获取治疗疾病最有效的方法 从住宅管理系统分析住户的用电模式,以降低能源消耗 个人软件助理跟踪用户的兴趣,选择最感兴趣的在线早间新闻 。。。。。。 基于分析和理解人类的学习能力 现实 不知道怎样使计算机具备和人类一样强大的学习能力 只有一些针对特点问题的算法 一些商业化的应用也产生 语音识别 数据挖掘 机器学习技术的一些成果 语音识别 预测肺炎的康复率 检测信用卡欺诈 高速公路上的自动驾驶 下棋 一些学科对机器学习的影响 人工智能 贝叶斯方法 计算复杂性理论 控制论 信息论 哲学 心理学和神经生物学 统计学 1.1 学习问题的标准描述 泛指:计算机程序能够通过经验来提高某任务处理性能的行为 定义:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E中学习 三要素:任务;性能标准;训练经验 几类问题的分析 西洋跳棋学习问题 手写识别问题 机器人驾驶学习问题 。。。。。。 扩展关于学习

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档