第1章引言.ppt

下载文档 降价啦

6
0
约3.72千字
约 41页
2017-07-05 发布于湖北
举报
版权申诉
保障服务

第1章引言.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第1章引言概要1

* * * * * * * * * * * * * * * 选择训练经验西洋跳棋学习问题的总结描述：任务T：下西洋跳棋性能标准P：世界锦标赛上击败对手的百分比训练经验E：和自己进行对弈为此，需要选择：要学习知识的确切类型对于这个目标知识的表示学习机制选择目标函数可选择的走子方式产生一个巨大的搜索空间，必须从中寻找最佳走子步骤目标函数：用以搜索最佳走子策略目标函数ChooseMove：输入：合法棋局集合的棋盘状态输出：某种走子方式不能直接实现：提供给系统的是间接的学习经验（对弈步骤及棋局结果）选择目标函数现实主义版的目标函数：可实现能够为任何给定棋局赋予一个数字评分新的目标函数：将任何合法的棋局映射为一个实数值，高分表示更好的棋局如何实现？反思：人是如何考虑当前的棋局形势的？选择目标函数 x1：棋盘上黑子的数量 x2：棋盘上红子的数量 x3：棋盘上黑王的数量 x4：棋盘上红王的数量 x5：被红子威胁的黑子的数量 x6：被黑子威胁的红子的数量实用的目标函数目标函数V：B ? R。 V把任一合法棋局映射为一个实数 V给较好的棋局较高的评分实现方法：先产生每一合法走子对应的所有后续棋局，然后实用V来选取其中最佳棋局，从而确定当前最佳走子具体定义V如下。。。目标函数V（b）如果b是最终胜局，那么V(b)=100 如果b是最终败局，那么V(b)=-100 如果b是最终和局，那么V(b)=0 如果b不是最终棋局，那么V(b)= V(b‘)，其中b’是从b开始，双方都采取最优对弈后可达到的终局问题：由于定义的递归性，运算效率不高实际选取V(b)的简化版本V (b)（近似目标函数，又称函数逼近）实际目标函数的表示查表法：根据不同的棋盘状态进行查表规则集合：根据不同的棋盘特征设立规则用于评价的二次多项式函数人工神经网络线性函数法：选择函数逼近算法由参变量和函数规则选择函数的表示方法：w0+w1x1+w2x2+。。。然后使用样例进行训练，以求得函数的参数训练可考虑使用最小均方误差：Least Mean Square，LMS 最终设计最终设计：执行系统（Performance System）鉴定器（Critic）泛化器（Generalizer）实验生成器（Experiment Generateor）最终设计图实验生成器执行系统鉴定器泛化器新问题解答路线训练样例假设完整设计过程 * * * * * * * * * * * * * * * * * * * * * 第1章引言学习问题的标准描述设计一个学习系统算法新世界算法如何塑造世界： /movie/2014/9/E/4/MA44RQGQ6_MA47DTLE4.html 机器学习编程语言选择 matlab：价格昂贵、非开源、性能平平 R：在2015年排名前十的编程语言中，R语言是提升最快的，倾向统计学 Perl：没落，目前主要用于编写简单的网络脚本 Python：老而弥坚（20年风雨），语法更容易被程序员接受计算性能比较慕课资源斯坦福大学公开课：机器学习课程 Andrew Ng： /special/opencourse/machinelearning.html 加州理工学院公开课：机器学习与数据挖掘 Yaser Abu-Mostafa： /special/opencourse/learningfromdata.html 网易云课堂收费。。。概念模式：区别事物的特征的时空组合模式识别：以事物的特征为依据识别事物 “机器”学习：机器经过学习和训练后，可以进行识别、推理、预测。理想计算机的自我学习能力：从医疗记录中学习，以获取治疗疾病最有效的方法从住宅管理系统分析住户的用电模式，以降低能源消耗个人软件助理跟踪用户的兴趣，选择最感兴趣的在线早间新闻。。。。。。基于分析和理解人类的学习能力现实不知道怎样使计算机具备和人类一样强大的学习能力只有一些针对特点问题的算法一些商业化的应用也产生语音识别数据挖掘机器学习技术的一些成果语音识别预测肺炎的康复率检测信用卡欺诈高速公路上的自动驾驶下棋一些学科对机器学习的影响人工智能贝叶斯方法计算复杂性理论控制论信息论哲学心理学和神经生物学统计学 1.1 学习问题的标准描述泛指：计算机程序能够通过经验来提高某任务处理性能的行为定义：对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善，那么我们称这个计算机程序在从经验E中学习三要素：任务；性能标准；训练经验几类问题的分析西洋跳棋学习问题手写识别问题机器人驾驶学习问题。。。。。。扩展关于学习

您可能关注的文档

文档评论（0）

yaocen + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第1章引言.ppt