- 1
- 0
- 约2.7千字
- 约 14页
- 2018-03-23 发布于天津
- 举报
可以被认为既包含决定采取什么动作的执行元件-read
学习Agent 一个学习Agent可以被认为既包含决定采取什么动作的执行元件,又包含修改执行元件使其能制定更好决策的学习元件。 一个学习元件的设计受到下列三个主要因素的影响: 将要学习的是执行元件的哪个组成部分; 对学习这些组成部分而言,可得到什么反馈; 组成部分是如何表示的。 学习中可用的反馈类型 学习中可用的反馈类型通常是决定智能体所面临的学习问题本质的最重要因素。一般分为三种类型: 有监督的 从它的输入和输出的实例中学习一个函数。对于完全可观察的环境,智能体总能够观察到它的行动所带来的影响,因此可以采用有监督学习的方法来学习预测它们,对于部分可观察的环境,会困难一些。 无监督的 在未提供明确的输出值的情况下,学习输入的模式。 强化学习 从强化事物中进行学习,而不是根据教师所说的应该做什么进行学习。 归纳学习(1)——确定性的有监督的学习 归纳学习(2)——确定性的有监督的学习 学习决策树 决策树归纳是最简单的但是最成功的学习算法形式之一。 作为执行元件的决策树 一棵决策树将用属性集合描述的事物或情景作为输入,并返回一个“决策”。输入的属性或输出值可以是离散的,也可以是连续的,学习一个离散值函数称为分类,学习一个连续函数称为回归。 实例说明:决定是否要等座位的决策树 从实例中归纳决策树 课堂讨论 针对下述问题画出其决策树:当十字路口的信号灯变为绿色时,判断是否
您可能关注的文档
- 聚木醣分解酵素在硫酸盐纸浆漂白上之应用-中兴大学森林系.pdf
- 均匀降雨时坡地之水流动力分析-水土保持学系-中兴大学.ppt
- 竣工环境保护验收意见-山东金诚石化集团.pdf
- 开槽埋管承插管企口管.doc
- 开堵眼机设备描述-鞍钢集团电子招标投标交易平台.doc
- 开会时间-中央大学总务处-国立中央大学.doc
- 抗菌谱-中南大学湘雅二医院.ppt
- 科举制度的涵义及科举科目概述.pdf
- 科学与工程计算方法及应用教学大纲.pdf
- 科举制的创立2奠基隋文帝废除九品中正制下令.ppt
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 骨科医院医疗质量委员会季度工作总结(3篇).docx VIP
- 深度解析(2026)《WST 414—2024 室间质量评价不合格原因分析》.pptx VIP
- 新22J01 工程做法参考标准.docx
- 2026年潍坊市招商发展集团有限公司公开招聘(12名)笔试参考试题及答案解析.docx VIP
- 有限空间作业安全培训试卷(含答案).doc VIP
- 2026年潍坊市招商发展集团有限公司公开招聘(12名)考试参考题库及答案解析.docx VIP
- 第二章《三维造型基础》构成要素课件.ppt VIP
- 新22G03 墙下扩展基础.docx
- 2023年度工程硕士模考模拟试题附参考答案详解【培优B卷】.docx
- (整理版)桐乡三中八年级英语下册第12周周周清 牛津.pdf
原创力文档

文档评论(0)