人工智能第二章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于模型的反射agent 第二十七页,共三十六页。 第二章 智能Agent 第一页,共三十六页。 内容提要 Agents和环境 理性Agent 环境的性质 Agent的类型与结构 第二页,共三十六页。 Agent Agent通过感知器感知环境并通过执行器对所处的环境产生影响 人类Agent 眼睛,耳朵为感知器 手,脚,声道为执行器 机器人Agent 摄像头,红外距测仪为感知器 马达为执行器 第三页,共三十六页。 Agent和环境 Agent函数将任何感知历史数据映射为行为: Agent程序通过在物理系统上运行来实现Agent函数 Agent = 体系结构 + 程序 第四页,共三十六页。 真空吸尘器世界 感知器:地点和内容(eg. [A,Dirty]) 行为:向左,向右,洗尘,无操作 第五页,共三十六页。 真空吸尘器世界 第六页,共三十六页。 理性Agent 理性agent:对于每一可能的感知数据序列,一个理性的agent应该采取一个行为以达到最大的性能。 理性判断的4个因素 性能度量 先验知识 可以完成的行动 截至到此刻的感知序列 第七页,共三十六页。 理性Agent 一个Agent应该根据它感知的信息和它能够进行的行为而做正确的事情 正确的行为将使得Agent能够取得最大的成功 性能度量:一个客观的标准来评价Agent的行为的成功性 Eg.真空器agent的性能度量可以是它清洗区域的数量,花费的时间,消耗的能量,产生的噪音等等 Eg.真空洗尘器8个小时内清理的灰尘总量来度量性能? 以行为来度量性能不如以结果来度量性能 第八页,共三十六页。 理性Agent 全知:明确知道它的行动产生的实际结果并且作出相应的动作 理性不等同于全知(已知的知识都是有限的) 理性不等于完美: 理性是使期望的性能最大化 完美是使实际的性能最大化 第九页,共三十六页。 理性Agent 理性agent能够进行信息收集。 理性的agent应该具有自主性,能够进行学习 从环境的感知信息中根据历史经验来学习 第十页,共三十六页。 任务环境 任务环境:包括性能(Performance),环境(Environment),agent的执行器(Actuators)和传感器(Sensors),英文缩写为PEAS 对于每一个智能agent,必须说明其PEAS参数 Eg.自动驾驶出租车 性能度量 环境 执行器 传感器 第十一页,共三十六页。 任务环境 Eg.自动驾驶出租车 性能度量:安全性,快速性,交通违规,舒适度,利润 环境:马路,其他交通工具,行人,乘客 执行器:方向盘,加速油门,刹车,语音合成器 传感器:摄像头,红外或声纳,速度表,GPS,键盘,麦克风 第十二页,共三十六页。 任务环境 ? Environment: Patient, hospital, staff ? Actuators: Screen display (questions, tests, diagnoses, treatments, referrals) ? Sensors: Keyboard (entry of symptoms, findings, patients answers) Eg.医疗诊断系统 性能度量:病人的健康性,病人花费 环境:病人,医院,工作人员 执行器:显示屏(询问,测试,诊断,治疗方案) 传感器:键盘(输入症状,现场检测,病人的回答) 第十三页,共三十六页。 任务环境 * Eg.挑拣零件机器人 性能度量:正确挑拣的零件所占的百分比 环境:零件传送带,容器 执行器:机器人手臂和手 传感器:摄像头,关节感知器 第十四页,共三十六页。 任务环境 * Eg.交互式英语教学者 性能度量:最大化学生成绩 环境:学生 执行器:显示屏(练习题,建议,正确答案) 传感器:键盘 第十五页,共三十六页。 环境的性质 * 完全可观察的 vs.部分可观察的 一个agent的传感器在每个时间点上都能获取环境的完整状态 一个agent的传感器在每个时间点上都能获取环境的部分状态 真空洗尘器?自动驾驶汽车? 单agent vs.多agent 单agent独自运行 eg.字谜游戏 多agent同时运行 eg.国际象棋 国际象棋 vs. 驾驶出租车? 第十六页,共三十六页。 环境的性质 确定的 vs.随机的 环境的下一个状态完全取决于当前状态和agent执行的动作 部分可观察? 出租车驾驶?真空吸尘器? 片段式的 vs. 延续式的 agent的经历被分成一个个原子片段,在每个片段中agent感知信息并完成单个行动,下一个片段不依赖于以前的片段 检查次品零件的机器人?国际象棋? 第十七页,共三十六页。 环境的性质 * 静态的 vs. 动态的 环境在agent计算的时候不会变化(vs

文档评论(0)

虾虾教育 + 关注
官方认证
文档贡献者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档