机器学习课件.pptxVIP

  • 133
  • 0
  • 约 553页
  • 2023-06-13 发布于山东
  • 举报
人在高处时勿戏人,人在相遇时勿算人人在离别时勿悔人,人在争取时要像人

2003.12.181机器学习第1章 引言 2003.12.182什么是机器学习什么是机器学习计算机程序如何随着经验积累自动提高性能系统自我改进的过程历史成功应用学习识别人类讲话学习驾驶车辆学习分类新的天文结构学习对弈西洋双陆棋 2003.12.183相关学科人工智能计算复杂性理论控制论信息论统计学 2003.12.184学习问题的标准描述定义如果一个计算机针对某类任务T的用P衡量的性能根据经验E来自我完善,那么我们称这个计算机程序在从经验E中学习,针对某类任务T,它的性能用P来衡量。西洋跳棋学习问题的解释E,和自己下棋T,参与比赛P,比赛成绩(或赢棋能力,击败对手的百分比)手写识别学习问题机器人驾驶学习问题 2003.12.185学习问题的标准描述(2)定义太宽泛甚至包括了以非常直接的方式通过经验自我提高的计算机程序实际的机器学习问题往往比较复杂定义一类问题探索解决这类问题的方法理解学习问题的基本结构和过程 2003.12.186设计一个学习系统基本设计方法和学习途径(以西洋跳棋为例)选择训练经验选择目标函数选择目标函数的表示选择函数逼近算法最终设计 2003.12.187设计一个学习系统西洋跳棋学习问题任务T,下西洋跳棋性能标准P,击败对手的百分比训练经验E,和自己进行训练对弈学习系统需要选择要学习的知识的确切类型对于这个目标知识的表示一种学习机制 2003.12.188选择训练经验第一个关键属性,训练经验能否为系统的决策提供直接或间接的反馈第二个重要属性,学习器在多大程度上控制样例序列第三个重要属性,训练样例的分布能多好地表示实例分布,通过样例来衡量最终系统的性能 2003.12.189选择目标函数目标函数ChooseMoveChooseMove: B?M,接受合法棋局集合中的棋盘状态作为输入,并从合法走子集合中选择某个走子作为输出问题转化我们把提高任务T的性能P的问题转化(或简化)为学习像ChooseMove这样某个特定的目标函数 2003.12.1810选择目标函数(2)ChooseMove的评价学习问题很直观地转化成这个函数这个函数的学习很困难,因为提供给系统的是间接训练经验另一个目标函数V一个评估函数,V: B?R,它为任何给定棋局赋予一个数值评分,给好的棋局赋予较高的评分优点,学习简单V的应用根据V能够轻松地找到当前棋局的最佳走法。 2003.12.1811选择目标函数(3)V的设计,对于集合B中的任意棋局b,V(b)定义如下如果b是一最终的胜局,那么V(b)=100如果b是一最终的负局,那么V(b)=-100如果b是一最终的和局,那么V(b)=0如果b不是最终棋局,那么V(b)=V(b’),其中b’是从b开始双方都采取最优对弈后可达到的终局 2003.12.1812选择目标函数(4)上面设计的缺陷递归定义运算效率低不可操作简评学习任务简化成发现一个理想目标函数V的可操作描述。通常要完美地学习这样一个V的可操作的形式是非常困难的。一般地,我们仅希望学习算法得到近似的目标函数V’,因此学习目标函数的过程常称为函数逼近。 2003.12.1813选择目标函数的表示函数的表示一张大表,对于每个唯一的棋盘状态,表中有唯一的表项来确定它的状态值规则集合二项式函数人工神经网络 2003.12.1814选择目标函数的表示(2)重要的权衡过程一方面,我们总希望选区一个非常有表现力的描述,以最大可能地逼近理想的目标函数另一方面,越有表现力的描述需要越多的训练数据,使程序能从它表示的多种假设中选择 2003.12.1815选择目标函数的表示(3)一个简单的表示法,对于任何给定的棋盘状态,函数V可以通过以下棋盘参数的线性组合来计算。x1,黑子的数量x2,红子的数量x3,黑王的数量x4,红王的数量x5,被红子威胁的黑子数量x6,被黑子威胁的红子数量 2003.12.1816选择目标函数的表示(4)目标函数V(b)=w0+w1x1+w2x2+…+w6x6其中,w0…w6是权值,表示不同棋局特征的相对重要性至此,问题转化为学习目标函数中的系数(即权值) 2003.12.1817选择函数逼近算法每个训练样例表示成二元对b,Vtrain(b)b是棋盘状态,Vtrain(b)是训练值比如,x1=0,x2=0,x3=1,x4=0,x5=0,x6=0,100训练过程从学习器可得到的间接训练经验中导出上面的训练样例调整系数wi,最佳拟合这些训练样例 2003.12.1818选择函数逼近算法(2)估计训练值困难处一个简单的方法,Vtrain(b)=V’(Successor(b))调整权值最佳拟合的定义,比如误差平方和最小寻找算法,比如最小均方法,LMS Least Mean Squares 2003.12.1819最终设计实验生成器执行系统泛化器鉴定器

文档评论(0)

1亿VIP精品文档

相关文档