人工智能之智能agent培训.pptVIP

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能之智能agent培训

第二章 智能Agent 内容提要 Agents和环境 理性Agent 环境的性质 Agent的类型与结构 Agent Agent通过感知器感知环境并通过执行器对所处的环境产生影响 人类Agent 眼睛,耳朵为感知器 手,脚,声道为执行器 机器人Agent 摄像头,红外距测仪为感知器 马达为执行器 Agent和环境 Agent函数将任何感知历史数据映射为行为: Agent程序通过在物理系统上运行来实现Agent函数 Agent = 体系结构 + 程序 真空吸尘器世界 感知器:地点和内容(eg. [A,Dirty]) 行为:向左,向右,洗尘,无操作 真空吸尘器世界 理性Agent 理性agent:对于每一可能的感知数据序列,一个理性的agent应该采取一个行为以达到最大的性能。 理性判断的4个因素 性能度量 先验知识 可以完成的行动 截至到此刻的感知序列 理性Agent 一个Agent应该根据它感知的信息和它能够进行的行为而做正确的事情 正确的行为将使得Agent能够取得最大的成功 性能度量:一个客观的标准来评价Agent的行为的成功性 Eg.真空器agent的性能度量可以是它清洗区域的数量,花费的时间,消耗的能量,产生的噪音等等 Eg.真空洗尘器8个小时内清理的灰尘总量来度量性能? 以行为来度量性能不如以结果来度量性能 理性Agent 全知:明确知道它的行动产生的实际结果并且作出相应的动作 理性不等同于全知(已知的知识都是有限的) 理性不等于完美: 理性是使期望的性能最大化 完美是使实际的性能最大化 理性Agent 理性agent能够进行信息收集。 理性的agent应该具有自主性,能够进行学习 从环境的感知信息中根据历史经验来学习 任务环境 任务环境:包括性能(Performance),环境(Environment),agent的执行器(Actuators)和传感器(Sensors),英文缩写为PEAS 对于每一个智能agent,必须说明其PEAS参数 Eg.自动驾驶出租车 性能度量 环境 执行器 传感器 任务环境 Eg.自动驾驶出租车 性能度量:安全性,快速性,交通违规,舒适度,利润 环境:马路,其他交通工具,行人,乘客 执行器:方向盘,加速油门,刹车,语音合成器 传感器:摄像头,红外或声纳,速度表,GPS,键盘,麦克风 任务环境  Environment: Patient, hospital, staff  Actuators: Screen display (questions, tests, diagnoses, treatments, referrals)  Sensors: Keyboard (entry of symptoms, findings, patients answers) Eg.医疗诊断系统 性能度量:病人的健康性,病人花费 环境:病人,医院,工作人员 执行器:显示屏(询问,测试,诊断,治疗方案) 传感器:键盘(输入症状,现场检测,病人的回答) 任务环境 14 Eg.挑拣零件机器人 性能度量:正确挑拣的零件所占的百分比 环境:零件传送带,容器 执行器:机器人手臂和手 传感器:摄像头,关节感知器 任务环境 15 Eg.交互式英语教学者 性能度量:最大化学生成绩 环境:学生 执行器:显示屏(练习题,建议,正确答案) 传感器:键盘 环境的性质 16 完全可观察的 vs.部分可观察的 一个agent的传感器在每个时间点上都能获取环境的完整状态 一个agent的传感器在每个时间点上都能获取环境的部分状态 真空洗尘器?自动驾驶汽车? 单agent vs.多agent 单agent独自运行 eg.字谜游戏 多agent同时运行 eg.国际象棋 国际象棋 vs. 驾驶出租车? 环境的性质 确定的 vs.随机的 环境的下一个状态完全取决于当前状态和agent执行的动作 部分可观察? 出租车驾驶?真空吸尘器? 片段式的 vs. 延续式的 agent的经历被分成一个个原子片段,在每个片段中agent感知信息并完成单个行动,下一个片段不依赖于以前的片段 检查次品零件的机器人?国际象棋? 环境的性质 18 静态的 vs. 动态的 环境在agent计算的时候不会变化(vs.会变化) 半动态的:环境本身不变化但agent的性能评价随时间变化 出租车,国际象棋,填字游戏? 离散的 vs.连续的 环境的状态,时间的处理方式以及agent的感知信息和行动都有离散/连续之分 国际象棋,出租车驾驶? 环境的性质 环境的性质决定了agent的设计 最难处理的情况: 部分可观察的,随机的,连续的,动态的,延续式的,多agent的 Agent函数和程序 一个agent用agent函数来表示 agent函数将感知数据序列映射为行为

文档评论(0)

189****2507 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档