- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于模型的反射agent 第二十七页,共三十六页。 第二章 智能Agent 第一页,共三十六页。 内容提要 Agents和环境 理性Agent 环境的性质 Agent的类型与结构 第二页,共三十六页。 Agent Agent通过感知器感知环境并通过执行器对所处的环境产生影响 人类Agent 眼睛,耳朵为感知器 手,脚,声道为执行器 机器人Agent 摄像头,红外距测仪为感知器 马达为执行器 第三页,共三十六页。 Agent和环境 Agent函数将任何感知历史数据映射为行为: Agent程序通过在物理系统上运行来实现Agent函数 Agent = 体系结构 + 程序 第四页,共三十六页。 真空吸尘器世界 感知器:地点和内容(eg. [A,Dirty]) 行为:向左,向右,洗尘,无操作 第五页,共三十六页。 真空吸尘器世界 第六页,共三十六页。 理性Agent 理性agent:对于每一可能的感知数据序列,一个理性的agent应该采取一个行为以达到最大的性能。 理性判断的4个因素 性能度量 先验知识 可以完成的行动 截至到此刻的感知序列 第七页,共三十六页。 理性Agent 一个Agent应该根据它感知的信息和它能够进行的行为而做正确的事情 正确的行为将使得Agent能够取得最大的成功 性能度量:一个客观的标准来评价Agent的行为的成功性 Eg.真空器agent的性能度量可以是它清洗区域的数量,花费的时间,消耗的能量,产生的噪音等等 Eg.真空洗尘器8个小时内清理的灰尘总量来度量性能? 以行为来度量性能不如以结果来度量性能 第八页,共三十六页。 理性Agent 全知:明确知道它的行动产生的实际结果并且作出相应的动作 理性不等同于全知(已知的知识都是有限的) 理性不等于完美: 理性是使期望的性能最大化 完美是使实际的性能最大化 第九页,共三十六页。 理性Agent 理性agent能够进行信息收集。 理性的agent应该具有自主性,能够进行学习 从环境的感知信息中根据历史经验来学习 第十页,共三十六页。 任务环境 任务环境:包括性能(Performance),环境(Environment),agent的执行器(Actuators)和传感器(Sensors),英文缩写为PEAS 对于每一个智能agent,必须说明其PEAS参数 Eg.自动驾驶出租车 性能度量 环境 执行器 传感器 第十一页,共三十六页。 任务环境 Eg.自动驾驶出租车 性能度量:安全性,快速性,交通违规,舒适度,利润 环境:马路,其他交通工具,行人,乘客 执行器:方向盘,加速油门,刹车,语音合成器 传感器:摄像头,红外或声纳,速度表,GPS,键盘,麦克风 第十二页,共三十六页。 任务环境 ? Environment: Patient, hospital, staff ? Actuators: Screen display (questions, tests, diagnoses, treatments, referrals) ? Sensors: Keyboard (entry of symptoms, findings, patients answers) Eg.医疗诊断系统 性能度量:病人的健康性,病人花费 环境:病人,医院,工作人员 执行器:显示屏(询问,测试,诊断,治疗方案) 传感器:键盘(输入症状,现场检测,病人的回答) 第十三页,共三十六页。 任务环境 * Eg.挑拣零件机器人 性能度量:正确挑拣的零件所占的百分比 环境:零件传送带,容器 执行器:机器人手臂和手 传感器:摄像头,关节感知器 第十四页,共三十六页。 任务环境 * Eg.交互式英语教学者 性能度量:最大化学生成绩 环境:学生 执行器:显示屏(练习题,建议,正确答案) 传感器:键盘 第十五页,共三十六页。 环境的性质 * 完全可观察的 vs.部分可观察的 一个agent的传感器在每个时间点上都能获取环境的完整状态 一个agent的传感器在每个时间点上都能获取环境的部分状态 真空洗尘器?自动驾驶汽车? 单agent vs.多agent 单agent独自运行 eg.字谜游戏 多agent同时运行 eg.国际象棋 国际象棋 vs. 驾驶出租车? 第十六页,共三十六页。 环境的性质 确定的 vs.随机的 环境的下一个状态完全取决于当前状态和agent执行的动作 部分可观察? 出租车驾驶?真空吸尘器? 片段式的 vs. 延续式的 agent的经历被分成一个个原子片段,在每个片段中agent感知信息并完成单个行动,下一个片段不依赖于以前的片段 检查次品零件的机器人?国际象棋? 第十七页,共三十六页。 环境的性质 * 静态的 vs. 动态的 环境在agent计算的时候不会变化(vs
您可能关注的文档
最近下载
- 2025年中国气泡水行业深度调研与行业竞争对手分析报告.docx
- 高等教育学教学课件电子教案全套课件.pptx VIP
- 46桂阳县方元镇秀里村和荷叶镇山田村历史遗留砷渣污染场地风险管控项目附件文本.docx VIP
- 2024人教版PEP英语三年级上册全册教学设计教案含反思.pdf
- 课题材料目录.pdf
- 美好生活劳动创造-中职生劳动教育教程PPT完整全套教学课件.pptx VIP
- 第十四届全多媒体课件大赛获奖作品名单-初中组.doc VIP
- 湖北省武汉市2020年中考英语真题(含答案).docx VIP
- 2026届高考写作指导:先行者与后来者作文主体段讲解.pptx VIP
- 《GBT_20801.1-2020_压力管道规范_工业管道_第1部分_总则》.pdf VIP
文档评论(0)