可以被认为既包含决定采取什么动作的执行元件-read.pptVIP

  • 1
  • 0
  • 约2.7千字
  • 约 14页
  • 2018-03-23 发布于天津
  • 举报

可以被认为既包含决定采取什么动作的执行元件-read.ppt

可以被认为既包含决定采取什么动作的执行元件-read

学习Agent 一个学习Agent可以被认为既包含决定采取什么动作的执行元件,又包含修改执行元件使其能制定更好决策的学习元件。 一个学习元件的设计受到下列三个主要因素的影响: 将要学习的是执行元件的哪个组成部分; 对学习这些组成部分而言,可得到什么反馈; 组成部分是如何表示的。 学习中可用的反馈类型 学习中可用的反馈类型通常是决定智能体所面临的学习问题本质的最重要因素。一般分为三种类型: 有监督的 从它的输入和输出的实例中学习一个函数。对于完全可观察的环境,智能体总能够观察到它的行动所带来的影响,因此可以采用有监督学习的方法来学习预测它们,对于部分可观察的环境,会困难一些。 无监督的 在未提供明确的输出值的情况下,学习输入的模式。 强化学习 从强化事物中进行学习,而不是根据教师所说的应该做什么进行学习。 归纳学习(1) ——确定性的有监督的学习 归纳学习(2) ——确定性的有监督的学习 学习决策树 决策树归纳是最简单的但是最成功的学习算法形式之一。 作为执行元件的决策树 一棵决策树将用属性集合描述的事物或情景作为输入,并返回一个“决策”。输入的属性或输出值可以是离散的,也可以是连续的,学习一个离散值函数称为分类,学习一个连续函数称为回归。 实例说明:决定是否要等座位的决策树 从实例中归纳决策树 课堂讨论 针对下述问题画出其决策树:当十字路口的信号灯变为绿色时,判断是否

文档评论(0)

1亿VIP精品文档

相关文档