网站大量收购独家精品文档,联系QQ:2885784924

交互式系统才是日常计算世界的典型形式,几乎最普通的系统.ppt

交互式系统才是日常计算世界的典型形式,几乎最普通的系统.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
交互式系统才是日常计算世界的典型形式,几乎最普通的系统

多Agent系统的标准结构(Jennings,2000) 标准结构的说明 包含多个Agent,通过通信互相交互; Agent可以在环境中动作,不同的Agent有不同的作用范围,表示它们可以控制、至少是影响环境的不同部分。在有些情况下,影响的范围可能会有重叠,而影响范围重叠的事实会产生Agent之间的依赖关系。例如不能通过同一道门。 Agent一般也会通过其他关系关联起来,如“权力”的例子,一个Agent是另一个Agent的老板。 第五章 多Agent交互 效用和偏好 自利的:即每个Agent对世界应该是什么样子有自己的偏好和愿望。 存在一个关于Agent偏好的结局或者状态的集合 效用和偏好 富人和穷人 偏好排序 偏好排序 的性质 多Agent相遇 环境函数例子 标准的博弈论收益矩阵 的表示法 优势策略 定义:优势 假设两个 的子集—— ,如果对i希望 中的每个结局超过 中的每个结局,则对于Agent i来说 优势于 举例见板书 进一步引出强优于 Nash(纳什)平衡 习题(1) 习题(2) 习题(3) 竞 争 竞争的定义: Agent i希望得到结局 超过得到结局 , 当且仅当Agent j希望得到 超过得到结局 这样,局中人的偏好相互处在完全对立的位置上:一个Agent要提高其效用,必须以另一个Agent的付出为代价。 例子?? 零和交互 定义:对于任何特定的结局,两个Agent的效用之和为零。 囚犯两难 囚犯两难问题的收益矩阵 囚犯两难问题的改进(Axelrod) 多Agent系统的依赖关系 * * 交互式系统才是日常计算世界的典型形式,几乎最普通的系统中也包含一些子系统,他们必须互相交互以成功地完成它们的任务。 构造单Agent-构造Agent社会 作用范围 博弈论相关介绍 效用和偏好 多Agent相遇 优势策略与Nash平衡 竞争与零和交互 囚犯两难 多Agent系统的依赖关系 例子1.石头、剪刀、布 休息,找水 未定,未定 找水,休息 未定,未定 找水,休息 休息,找水 找水,休息 休息,找水 未定,未定 猪八戒 石头    剪刀   布 孙悟空 石头 剪刀 布 定义:博弈论是专门研究博弈如何出现均衡的规律的学科。 例子2.诺曼底登陆 定义:博弈是指决策主体在相互对抗中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。 失败,成功 成功,失败 成功,失败 失败,成功 德军 马赛设防 诺曼底设防 盟军 马赛登陆 诺曼底登陆 博弈的四要素 参与者:参与博弈的决策主体。判断博弈参与者的根本标志是是否是博弈的利害关系者。 博弈的规则:对博弈作出具体规定的集合。它包含对参与者行动顺序的规定、当某个参与者行动时他所知道的信息、有什么样的行动可供选择、选择之后会有什么样的结果,等等。 结果:对所有参与者的每一个可能的行动组合,会出现什么样的结果。 收益:在可能的每一个结果上,参与者的所得和所失,就是在所有可能的结果上参与者的偏好是什么,这意味着博弈的每一位参与者会在不同结果之间进行比较,以寻求最好的收益。 博 弈 的 表 述 可以用参与者、策略和收益函数来表述一个博弈。 孙悟空的策略函数: 猪八戒的策略函数: 如石头、剪刀、布的例子: 参与者集合:I={1,2} //其中1表示孙悟空,2表示猪八戒 收益函数是策略组合和收益之间所建立的一种函数关系。 如: 博 弈 的 分 类 静态博弈 动态博弈 完全信息博弈 不(非)完全信息博弈 如果博弈双方同时行动,即一方在作出行动时并不清楚对手是否已经作出了行动,则为静态博弈。如果一方在作出行动时,知道对手已经作出了行动(可能不知道具体行动是什么),则为动态博弈。 如果所有参与者对其收益的信念是确定的,那么这个博弈就是完全信息的。也就是每一个参与者都能明确地计算出彼此的收益。相反,则为不完全信息博弈。 博弈的其他例子 1.鸽派和鹰派 2.烛光晚餐 3.…… 思考:能否将身边一些情况描述成博弈?具体例子?抽象成博弈的四个要素,并进行表述和分类。 假设只有两个Agent为i和j 可以用效用函数形式化地描述这两个Agent的偏好,每个Agent有一个效用函数。给每个结局赋予一个实数,表示这个结局对于该Agent来说有多“好”,数值越大,从这个Agent的角度来说效用越好。 导出一个关于输出的偏好排序 效用和金钱的比喻 在一个小区内,住着一个富人和一个穷人。组织夜间巡逻能有效防止偷盗,但夜间巡逻的成本为4。假设富人的财产为8,穷人的财产为2。如果两人都巡逻,那么巡逻成本由两人均摊,如果只有一人巡逻,则由巡逻者承担。 0,0 8

文档评论(0)

sunhao111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档