- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能之智能agent培训
第二章 智能Agent
内容提要
Agents和环境
理性Agent
环境的性质
Agent的类型与结构
Agent
Agent通过感知器感知环境并通过执行器对所处的环境产生影响
人类Agent
眼睛,耳朵为感知器
手,脚,声道为执行器
机器人Agent
摄像头,红外距测仪为感知器
马达为执行器
Agent和环境
Agent函数将任何感知历史数据映射为行为:
Agent程序通过在物理系统上运行来实现Agent函数
Agent = 体系结构 + 程序
真空吸尘器世界
感知器:地点和内容(eg. [A,Dirty])
行为:向左,向右,洗尘,无操作
真空吸尘器世界
理性Agent
理性agent:对于每一可能的感知数据序列,一个理性的agent应该采取一个行为以达到最大的性能。
理性判断的4个因素
性能度量
先验知识
可以完成的行动
截至到此刻的感知序列
理性Agent
一个Agent应该根据它感知的信息和它能够进行的行为而做正确的事情
正确的行为将使得Agent能够取得最大的成功
性能度量:一个客观的标准来评价Agent的行为的成功性
Eg.真空器agent的性能度量可以是它清洗区域的数量,花费的时间,消耗的能量,产生的噪音等等
Eg.真空洗尘器8个小时内清理的灰尘总量来度量性能?
以行为来度量性能不如以结果来度量性能
理性Agent
全知:明确知道它的行动产生的实际结果并且作出相应的动作
理性不等同于全知(已知的知识都是有限的)
理性不等于完美:
理性是使期望的性能最大化
完美是使实际的性能最大化
理性Agent
理性agent能够进行信息收集。
理性的agent应该具有自主性,能够进行学习
从环境的感知信息中根据历史经验来学习
任务环境
任务环境:包括性能(Performance),环境(Environment),agent的执行器(Actuators)和传感器(Sensors),英文缩写为PEAS
对于每一个智能agent,必须说明其PEAS参数
Eg.自动驾驶出租车
性能度量
环境
执行器
传感器
任务环境
Eg.自动驾驶出租车
性能度量:安全性,快速性,交通违规,舒适度,利润
环境:马路,其他交通工具,行人,乘客
执行器:方向盘,加速油门,刹车,语音合成器
传感器:摄像头,红外或声纳,速度表,GPS,键盘,麦克风
任务环境
Environment: Patient, hospital, staff
Actuators: Screen display (questions,
tests, diagnoses, treatments, referrals)
Sensors: Keyboard (entry of symptoms,
findings, patients answers)
Eg.医疗诊断系统
性能度量:病人的健康性,病人花费
环境:病人,医院,工作人员
执行器:显示屏(询问,测试,诊断,治疗方案)
传感器:键盘(输入症状,现场检测,病人的回答)
任务环境
14
Eg.挑拣零件机器人
性能度量:正确挑拣的零件所占的百分比
环境:零件传送带,容器
执行器:机器人手臂和手
传感器:摄像头,关节感知器
任务环境
15
Eg.交互式英语教学者
性能度量:最大化学生成绩
环境:学生
执行器:显示屏(练习题,建议,正确答案)
传感器:键盘
环境的性质
16
完全可观察的 vs.部分可观察的
一个agent的传感器在每个时间点上都能获取环境的完整状态
一个agent的传感器在每个时间点上都能获取环境的部分状态
真空洗尘器?自动驾驶汽车?
单agent vs.多agent
单agent独自运行 eg.字谜游戏
多agent同时运行 eg.国际象棋
国际象棋 vs. 驾驶出租车?
环境的性质
确定的 vs.随机的
环境的下一个状态完全取决于当前状态和agent执行的动作
部分可观察?
出租车驾驶?真空吸尘器?
片段式的 vs. 延续式的
agent的经历被分成一个个原子片段,在每个片段中agent感知信息并完成单个行动,下一个片段不依赖于以前的片段
检查次品零件的机器人?国际象棋?
环境的性质
18
静态的 vs. 动态的
环境在agent计算的时候不会变化(vs.会变化)
半动态的:环境本身不变化但agent的性能评价随时间变化
出租车,国际象棋,填字游戏?
离散的 vs.连续的
环境的状态,时间的处理方式以及agent的感知信息和行动都有离散/连续之分
国际象棋,出租车驾驶?
环境的性质
环境的性质决定了agent的设计
最难处理的情况:
部分可观察的,随机的,连续的,动态的,延续式的,多agent的
Agent函数和程序
一个agent用agent函数来表示
agent函数将感知数据序列映射为行为
您可能关注的文档
- 演讲与口才培训教材.ppt
- 演讲与口才培训讲义.ppt
- 某公司运作手册.ppt
- 演讲技巧培训讲义.ppt
- 现金流量与资金时间价值概述.ppt
- 演讲口才与演讲技巧培训课件.ppt
- 税务会计课件盖地.ppt
- 现代物流学概述.ppt
- 电视广告的策划与创意课件.ppt
- 税收制度培训.ppt
- 2025年露营地智慧照明系统在智慧旅游项目中的照明需求预测与市场分析.docx
- 高中英语课堂中跨文化思辨能力的教学策略.docx
- 文创IP联名合作风险防范策略及市场洞察.docx
- 2025年线上职业技能鉴定平台与职业教育改革协同发展报告.docx
- 2025年工业废气治理政策与催化燃烧技术应用研究报告.docx
- 针对2025年城市轨道交通站点周边交通组织调整的社会稳定风险防范措施分析报告.docx
- 银发教育课程设计与学习体验优化策略研究报告.docx
- 2025年无人机适航认证案例在地质勘探中的勘探数据处理报告.docx
- 五上期末测试卷(B).pdf
- 商业地产存量盘活2025年策略与区域商业竞争力提升.docx
文档评论(0)