- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
智能化智能体大纲智能体和环境理性的概念环境的本质和类型智能体类型智能体和环境智能体和环境什么是智能体通过传感器(Sensor)感知环境(Environment)通过执行器(actuator)作用到环境例如人类智能体传感器: 眼、耳、鼻等执行器: 手、足、嘴等机器人智能体传感器: 摄像机、红外设备等执行器: 各种马达等智能体和环境形式化描述智能体函数f:从感知历史(percept history)到行动(action)[f: P* ? A]
智能体程序:在物理体系结构上运行以实现f智能体 = 体系结构 + 程序例:真空吸尘器感知位置和是否干净如:[A, Dirty]
行动左移(Left)右移(Right)吸尘(Suck)发呆(NoOP)真空吸尘器智能体感知序列行动[A,Clean]Right[A, Dirty]Suck[B, Clean]Left[B, Dirty]Suck[A, Clean],[A, Clean]Right[A, Clean],[A, Dirty]Suck……大纲智能体和环境理性的概念环境的本质和类型智能体类型理性智能体能够“做正确的事”(do the right thing)的智能体基于它的感知及它能执行的行动如 [A,Dirty] - Suck * [A, Dirty] - NoOp * [A, Dirty] - Beep正确的行动使智能体更加成功的行动理性智能体性能度量(Performance measure)度量智能体行为成功程度的判断标准如:真空吸尘器智能体的不同性能度量 清扫的灰尘数量花费的时间耗电量产生的噪声理性智能体理性智能体的定义给定感知序列(percept sequence)和内在知识(built-in knowledge),理性智能体能够选择使得性能度量的期望值(expected value)最大的行动理性取决于给定的性能度量内在的先验知识可以执行的行动感知序列思考:真空吸尘器智能体是理性的吗?吸尘器的设计原则如果所处方格有垃圾,则清洁否则,移动到另一个方格在这样的假设下性能度量:每个单位时间内,每个清洁的方格数+1,总时间为1000个单位时间先验知识:只有两个方格(环境)、吸尘能清洁不干净的方格动作:左移、右移、吸尘、发呆感知:所在位置、是否干净如果性能度量加上一條:每移动一次 -1,又如何?理性智能体理性 ? 全知(omniscience)全知:知道它的行动的实际效果并作出相应的行动如: 过马路理性 ? 完美(perfect)行动的结果可能不如预期结构约束:时间、内存等所以:理性 ? 成功理性智能体为了更加成功,理性智能体需要:观察:信息收集如:过马路需要首先观察路况学习环境是先验知识,但是也需根据感知进行学习(自主性),以改變/增加這些知識。反例如:蜣螂推糞球堵住窩的入口黑足泥蜂 “拖毛虫到地洞”大纲智能体和环境理性的概念环境的本质和类型智能体类型任务环境PEASPEAS性能度量(Performance measure)环境(Environment)执行器(Actuators)传感器(Sensors)在设计智能化智能体时必须首先指定还记得“真空吸尘器智能体”的任务环境吗?智能体: 自动出租车司机 性能度量安全、快速、守法、舒适、利润最大环境 路况、其他车辆、乘客、行人执行器 方向盘、加速器、刹车、信号灯传感器摄像头、声波传感器、GPS、速度计、里程计、键盘智能体: 挑选零件的机器人性能度量放进正确的箱子的零件的百分比环境载有箱子的传送带、箱子执行器 有关节的胳膊和手传感器 摄像头、关节角度传感器智能体: 网上购物智能体性能度量价格、质量、效率环境万维网网站、商家执行器 显示给用户、填写表单、链接URL传感器 HTML页面、用户输入任务环境的类型完全可观察 vs. 部分可观察传感器是否获取环境的所有状态确定性的 vs. 随机的环境的下一个状态是否完全取决于当前状态和智能体的行动片段式的 vs. 延续式的智能体当前行动的选择是否不依赖于以前的行动静态的 vs. 动态的环境是否随着智能体的思考(亦即時間流逝)发生改变离散的 vs. 连续的环境的状态、时间处理、智能体的行动等是离散或连续单智能体 vs. 多智能体环境类型环境类型决定了智能体的设计出租车零件挑选机网上购物机器人可观察? 部分 部分部分确定的?NONONO片段的?NOYESNO静态的?NONONO离散的?NONOYES单智能体?NOYESYES大纲智能体和环境理性的概念环境的本质和类型智能体类型智能体类型智能体 = 体系结构 + 智能体程序所有的智能体程序都具有相同的架构输入 = 当前感知输出 = 行动程序 = 操作输入产生输出最简单的智能体:表驱动的智能体一个表记录所有的感知序列及其最佳行动。在运行时只需要根据感知,查
原创力文档


文档评论(0)