- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 课程主要内容 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈 * 完全信息静态博弈概念 概念:各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例 石头、剪子、布游戏 彼此了解的两个厂商的价格战 * 完全信息静态博弈概念 有些实际博弈 虽然决策不是在绝对时间意义上的“同时”, 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 如不同竞标单位作出的工程投标决策 * 博弈的策略式表述 常用G表示一个博弈 博弈模型的两种表示形式 策略式表述 (Strategic form), 扩展式表述(Extensive form) 本章主要介绍博弈的策略式表述 * 博弈的策略式表述 参与人集合 N人博弈的参与人集合,往往也记为N。参与人则记为i, i∈ N 参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si ∈ Si. * 对于给定的参与人i, i=1,2,…N, 卡氏积 S1×S2 … ×Si-1 × Si+1 …× Sn 表示除了参与人i外所有参与人所有策略的可能组合,通 常记为S-i; 于是所有参与人不同策略组合构成的策略空间可表示为 S=(Si , S-i) 博弈的策略式表述 * Si中的元素 si 表示参与人i的一个具体策略 一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1, s2, … sN),s∈S。 博弈的策略式表述 * 参与人i的效用函数 参与人 i的支付函数,是从博弈局势集 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn)的偏好。 一个博弈可以表示为 G = {S1, … ,SN; u1, … ,uN, i ∈N} 这就是博弈的策略式表述 博弈的策略式表述 * 博弈的策略式表述 例 写出囚徒问题的策略式表述 参与人集合N={囚徒1,囚徒2} 参与人的策略集S1=S2= {坦白,不坦白} 各参与人的支付,可用图1-1表示。 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-1 囚徒问题的支付矩阵 囚徒1 囚徒2 * 博弈的策略式表述 实质上,图1-1已经完全表述了囚徒困境的策略式表述信息 称图1-1为二人有限博弈的双矩阵 (bimatrix)表述 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-1 囚徒问题的支付矩阵 囚徒1 囚徒2 * 占优均衡 英文术语:Dominant-strategy Equilibrium 定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 * 占优策略 对于所有的s-i, si*称为参与人i的严格占优战略,如果满足: ui(si*,s-i)ui(si,s-i) ? s-i, ? si ?si* * 占优均衡 占优均衡定义 一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 * 占优均衡 占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚徒问题的支付矩阵 囚徒1 囚徒2 * 占优均衡 以囚徒1为例,无论囚徒2采取什么策略… 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚徒问题的支付矩阵 囚徒1 囚徒2 * 占优均衡 坦白总是占优策略 图1-2 囚徒问题的支付矩阵 囚徒1 囚徒2 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) * 占优均衡 由于矩阵的对称性,对囚徒2来说亦可得出类似结论 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚徒问题的支付矩阵 囚徒1 囚徒2 * 占优均衡 因此,该博弈的策略组合(坦白、坦白)是占优均衡。 图1-2 囚徒问题的支付矩阵 囚徒1 囚徒2 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) * 上一讲内容回顾 博弈论用处(解释、预测和提出
您可能关注的文档
最近下载
- 江苏省连云港市东海县实验中学2024-2025学年九年级上学期第一次月考语文试题(含答案).pdf VIP
- Sharp夏普扫描仪DW-D20HZ-W DW-D20NZW3 CF-20HZW 3用户手册.pdf
- 2024-2025学年九年级语文上学期第一次月考试卷附答案解析.pdf VIP
- C站JUE-85中文操作说明书-07-9-10.pdf VIP
- 智能融合终端通用技术规范2025.docx
- 2024年中级经济师《经济基础》真题卷(1116下午).pdf VIP
- 660MW发电机内冷水系统漏氢原因分析处理.pdf VIP
- 管道命名及代码含义.docx VIP
- 认知心理学第四章记忆解析.ppt VIP
- 外墙抹灰安全技术交底.pdf VIP
文档评论(0)