交互式系统才是日常计算世界的典型形式,几乎最普通的系统.ppt

下载文档 降价啦

3
0
约3.76千字
约 30页
2016-08-18 发布于天津
举报
版权申诉
保障服务

交互式系统才是日常计算世界的典型形式,几乎最普通的系统.ppt

1、本文档共30页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

交互式系统才是日常计算世界的典型形式,几乎最普通的系统

多Agent系统的标准结构（Jennings,2000）标准结构的说明包含多个Agent，通过通信互相交互； Agent可以在环境中动作，不同的Agent有不同的作用范围，表示它们可以控制、至少是影响环境的不同部分。在有些情况下，影响的范围可能会有重叠，而影响范围重叠的事实会产生Agent之间的依赖关系。例如不能通过同一道门。 Agent一般也会通过其他关系关联起来，如“权力”的例子，一个Agent是另一个Agent的老板。第五章多Agent交互效用和偏好自利的：即每个Agent对世界应该是什么样子有自己的偏好和愿望。存在一个关于Agent偏好的结局或者状态的集合效用和偏好富人和穷人偏好排序偏好排序的性质多Agent相遇环境函数例子标准的博弈论收益矩阵的表示法优势策略定义：优势假设两个的子集—— ，如果对i希望中的每个结局超过中的每个结局，则对于Agent i来说优势于举例见板书进一步引出强优于 Nash（纳什）平衡习题（1）习题（2）习题（3）竞争竞争的定义： Agent i希望得到结局超过得到结局，当且仅当Agent j希望得到超过得到结局这样，局中人的偏好相互处在完全对立的位置上：一个Agent要提高其效用，必须以另一个Agent的付出为代价。例子？？零和交互定义：对于任何特定的结局，两个Agent的效用之和为零。囚犯两难囚犯两难问题的收益矩阵囚犯两难问题的改进（Axelrod）多Agent系统的依赖关系 * * 交互式系统才是日常计算世界的典型形式，几乎最普通的系统中也包含一些子系统，他们必须互相交互以成功地完成它们的任务。构造单Agent-构造Agent社会作用范围博弈论相关介绍效用和偏好多Agent相遇优势策略与Nash平衡竞争与零和交互囚犯两难多Agent系统的依赖关系例子１．石头、剪刀、布休息，找水未定，未定找水，休息未定，未定找水，休息休息，找水找水，休息休息，找水未定，未定猪八戒石头　　　　剪刀　　　布孙悟空石头剪刀布定义：博弈论是专门研究博弈如何出现均衡的规律的学科。例子２．诺曼底登陆定义：博弈是指决策主体在相互对抗中，对抗双方（或多方）相互依存的一系列策略和行动的过程集合。失败，成功成功，失败成功，失败失败，成功德军马赛设防　诺曼底设防盟军马赛登陆诺曼底登陆博弈的四要素参与者：参与博弈的决策主体。判断博弈参与者的根本标志是是否是博弈的利害关系者。博弈的规则：对博弈作出具体规定的集合。它包含对参与者行动顺序的规定、当某个参与者行动时他所知道的信息、有什么样的行动可供选择、选择之后会有什么样的结果，等等。结果：对所有参与者的每一个可能的行动组合，会出现什么样的结果。收益：在可能的每一个结果上，参与者的所得和所失，就是在所有可能的结果上参与者的偏好是什么，这意味着博弈的每一位参与者会在不同结果之间进行比较，以寻求最好的收益。博　弈　的　表　述可以用参与者、策略和收益函数来表述一个博弈。孙悟空的策略函数：猪八戒的策略函数：如石头、剪刀、布的例子：参与者集合：I={1,2} //其中１表示孙悟空，２表示猪八戒收益函数是策略组合和收益之间所建立的一种函数关系。如：博　弈　的　分　类静态博弈动态博弈完全信息博弈不（非）完全信息博弈如果博弈双方同时行动，即一方在作出行动时并不清楚对手是否已经作出了行动，则为静态博弈。如果一方在作出行动时，知道对手已经作出了行动（可能不知道具体行动是什么），则为动态博弈。如果所有参与者对其收益的信念是确定的，那么这个博弈就是完全信息的。也就是每一个参与者都能明确地计算出彼此的收益。相反，则为不完全信息博弈。博弈的其他例子１．鸽派和鹰派２．烛光晚餐３．…… 思考：能否将身边一些情况描述成博弈？具体例子？抽象成博弈的四个要素，并进行表述和分类。假设只有两个Agent为i和j 可以用效用函数形式化地描述这两个Agent的偏好，每个Agent有一个效用函数。给每个结局赋予一个实数，表示这个结局对于该Agent来说有多“好”，数值越大，从这个Agent的角度来说效用越好。导出一个关于输出的偏好排序效用和金钱的比喻在一个小区内，住着一个富人和一个穷人。组织夜间巡逻能有效防止偷盗，但夜间巡逻的成本为４。假设富人的财产为８，穷人的财产为2。如果两人都巡逻，那么巡逻成本由两人均摊，如果只有一人巡逻，则由巡逻者承担。 0，0 8