- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈计算
云南大学软件学院2008 年秋季学期
系统设计与实现项目 —— 网络生成博弈
指导教师:李劲
一、博弈论简介
通过一个博弈的实例,介绍博弈论的相关概念。
例1.1 如图1.1 所示的囚徒博弈
囚徒2
招供 沉默
-6,-6 0,-9
招供
囚徒1
-9 , 0 -1 ,-1
沉默
图1.1 囚徒博弈
囚徒博弈讲述的是如下一个情形:警方抓住了两个犯罪嫌疑人,囚徒1、囚徒2 ,
但警方掌握的证据不足,因而需要将进一步审讯提取口供。警方将两个囚徒分别置于
不同的房间,但告诉两囚徒相同的信息,即如果一方沉默,而另一方招供,那么招供
方立即释放,沉默方将被判入狱9 个月;如果双方都沉默,那么两人将在一个月后因
证据不足而释放;如果双方都招供,那么两人都将被判6 个月。如果每个囚徒都假设
对方将置自己于最不利(即博弈双方为非合作关系),此时对任一个囚徒来说,他是
选择“招供”,还是选择“沉默”呢?
上例虽然简单,但它给出了一个博弈情形的生动实例。博弈问题一般含有五个要
素:局中人、每个局中人的可行方案集、局中人决策的先后顺序、每个局中人的收益
函数、信息。
所谓局中人,是指在问题中为自己的利益进行决策的各方,如上例中的两个囚徒。
特别地,在后文中我们把局中人称作Agent 。
可行方案集是Agent 可以采取的行动方案的全体,如上例中每个囚徒都有两个可
选的行动集{“招供” 、“沉默”} 。在博弈问题中,Agent 在其可行方案上的选择,便
是决策分析。许多学者把Game Theory 称为对策论,就是由于在对抗冲突的条件下进
行决策分析。
决策的先后顺序是实际问题动态性质的反映,任何一种博弈的规则都要明确各个
Agent 进行决策分析的时间先后。如果各个Agent 是同时进行决策,问题便是静态博
弈。还有一种情形也是静态博弈,那就是不同Agent 决策时间由先后顺序,但后决策
的Agent 并不知道前于其决策的Agent 选择了什么行为方案。除开上述两种情形,问
题都是动态博弈。囚徒博弈就是一个静态博弈的例子。
收益函数是博弈最后结果中各个Agent 利益的表示。在上面的囚徒博弈中,我们
用效用矩阵来表示每种博弈结果下两个囚徒的收益,例如,如果囚徒博弈最终的博弈
格局(结果)是“沉默”,“沉默” (表示两个囚徒都选择“沉默” ),那么囚徒 1 的利
益是-1,囚徒2 的利益是-1 ;如果博弈格局是“沉默”,“招供”,那么囚徒1 的利益
是-9,而囚徒2 的利益是0,如此等等。需要注意的是当问题中出现不确定性时,收
益通常是估值,比方说行为结果的数学期望。
信息指的是Agent 在决策时对其决策条件的知识。信息包括两类,一类是有哪些
Agents ,他们的可行方案集是什么,所有Agents 的收益函数是怎样的;另一类是Agent
决策前已作过的决策结果。在博弈中,如果所有Agents 对前一类信息有确切的了解,
就称之为完全信息的博弈,否则称之为不完全信息博弈。而在博弈中如果所有Agents
对后一类信息有确切的了解,就称之为完美信息博弈,否则称之为不完美信息博弈。
上面的囚徒博弈是一个静态完全信息博弈的实例。
在博弈分析中,我们假定所有局中人都是理性的决策者,即博弈方以最优化自己
的利益作为行动选择标准进行决策。
下面我们给出博弈的形式化定义。
定义 1.1 称三元组N , (S ), (u ) 为策略博弈(strategic game ),或正规博弈
i i
(normal game ),其中
N ={Age
原创力文档


文档评论(0)