人工智能入门 课件 刘峡壁5.行为智能、6.群智能.ppt

人工智能入门 课件 刘峡壁5.行为智能、6.群智能.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

AI:ANN*群体智能(续)群体智能系统通常由相互之间以及与环境进行局部交互的大量简单代理组成。虽然通常不存在决定个体代理应如何行为的集中控制结构,但这些代理之间的局部交互往往会导致全局行为的涌现。有时被称为“集体智能”AI:SI*群体智能的组成部分代理:与世界和其他代理(直接或间接)进行交互简单的行为例如:蚂蚁、白蚁、蜜蜂、黄蜂通信:代理如何相互交互例如:蚂蚁的信息素单个代理的简单行为+一组代理之间的通信=该组代理的涌现复杂行为AI:ANN*间接通信信号传播:-一个代理发送一个信号,该信号被广播到环境中,并且其强度随着距离的减小而减小。-在点x处,信号可能有以下强度之一:V(x)=V(x0)/dist(x,x0)V(x)=V(x0)/dist(x,x0)2路径-代理留下“放射性碎屑”形成路径-一个代理跟随路径,使路径逐渐变淡,直到消失AI:SI*间接通信黑板系统-一个公共区域(共享内存),代理可以在其中交换信息、数据和知识。-黑板=强大的分布式知识计算范例-代理=知识源(KS)IntelligentAgentsIntelligentAgentsIntelligentAgentsBlackboardMessageReplyAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsAI:SI*直接通信Actor语言一个Actor执行一系列动作以回复接收到的消息言语行为理论言语行为具有以下三个方面:Locution=说话者的物理表达Illocution=说话者话语的意图意义(施为)Perlocution=Locution产生的动作例如:张告诉李:“请把门关上”。 locution illocutioncontent perlocution:门关上了(希望如此!)AI:ANN*群智能特点分布式,没有中央控制或数据源通信有限没有(显式的)环境模型感知环境(感知)能够应对环境变化。群体智能与人类有关吗?AI:SI*PartⅡ-Ⅲ:如何模拟群体智能进行搜索?示例1:蚂蚁--蚁群优化算法(ACO)示例2:鸟群--粒子群优化算法(PSO)AI:SI*PartⅡ蚁群优化算法(ACO)AI:NouvelleAI*InteRRaP分层的混合结构:在不同的层次上对环境进行建模存在不同层次的表示不同层次的知识和推理在垂直分层的结构中只有相邻层之间存在通信行为层(与领域相关)规划层(非社会性的目标驱动行为)协作层(社会行为,如联合规划等)AI:NouvelleAI*InteRRaP结构/~chrender/Agenten/Agenten.htmlAI:NouvelleAI*1.3智能体的学习智能体要与动态变化的负责的外部环境进行交互,因此智能体需要进行自主学习。学习的基本思想如下:智能体感知到的知识不只是用来决定下一步行动,也用来提高智能体的能力,以在后面的行动中表现更佳。AI:NouvelleAI*学习类型监督学习函数学习需要的输入输出对已经给定或者可以推导得到。非监督学习没有输出的信息强化学习智能体在环境中作出行动,对于智能体的每一步行动,都会得到一个评价值,但是不被告知如何行动才可以正确的达到目标。√AI:NouvelleAI*PartⅡ:强化学习(RL)AI:NouvelleAI*3.1强化学习简介强化学习是一种通过奖励和惩罚来实现智能体的方式,无需指定完成何种任务.(Kaelbling,1996)智能体怎样如何从成功和失败中学习,从奖励和惩罚中学习?基于试错交互方式AI:NouvelleAI*强化学习模型Picture:R.Sutton:ReinforcementLearning:ATutorialAI:NouvelleAI*经典示例-房间里的机器人向上的行为:80%移动到了上方,10%移动到了左方,10%移动到了右方在[4,3]处奖励为+1,在[4,2]处的奖励为-1,其他步为0RussellandNo

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档