- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最大熵原理在不完全信息博弈中的应用.pdf
2011 年第 3 期
管:;宿踌贸易A静警报
最大脑原理在不完全信息博弈中的应用
陶桂平1 ,韩立岩2
(1.首都经济贸易大学统计学院,北京 1ω070;
2. 北京航空航天大学经济管理学院,北京 l∞083)
摘 要:在不究会馆息博弈中,至少有一个参与人不知道其他,参与人的支付函数,需要选择合适的
模型,通过先验信息和样本数据来推断其他参与人的支付函数。鉴于最大煽分布是主观偏见最小、不确
定性最大的概率分布,本文提出在不完全信息博鼻中,可以借助最大煽分布来刻画未知的真实分布以有
利于稳健决策,并分析了最大煽原埋在分赞糕、问题中的具体应用,进而得到一个最客观、最可能的
聚点均衡。
关键询:最大煽原理,不完全信息,分蛋糕、问题,聚点均衡,稳健
中团分3障碍: F224 文献标识码:A 文章编号: 1∞8 甲 2700 (2011) 03-∞67 叩 05
…、引窗
在完全信息博弈中,每个参与人都知道其他参句人的支付函数(或偏好面数) ,并且所有参与人都知
道所有参与人知道所有参与人的支付函嫩。但是现实世界中我们掌据的倍息经常是有限的、不完全的,
这引发了不完全信息博弈的研究。在不完全信息博弈中,重少有一个参与人不知道其他参与人的支付函
数,需要通过先验信息和样本数据等信息来推断其伽参与人的支付踊数,然后进行决策。
由于在不完全信息下,符合先瞌信息和样本数据的概率分布往往有很多个,参与人一般希望既充分
利用其中有用的信息,义对未知的真实分布做较少的假设,进而给出一个较为客观的概率分布。常用的
方法有经验似然方法、最大摘方法、最小相对娴方法、矩方法和贝叶斯姬方法等,这些方法都可以归结
为在分布的一定约束下最大化成最小化某个信息准则,其中最大铺原理和最小相对峭准则应用最为广泛。
最大摘原理提供了一个在满足约束的众多概率分布中选择分布的准则,即选择满足该约束并且使情最大
的分布。在实际问题中,有时我们可以得到一个先验分布,从而在模型分布选择时,不仅希望其满足原
有的约束条件,还要尽町能地接近诙先验概率分布,这时町以借助最小相对胸准则来瑞择概率分布,即
选择满足…定约束并且与先验分布的相对蛐最小的分布。这两种信息准则互相独立,但又紧密联系。
收稿日朔: 2011 翩 03 -02
基金项目:国家自然科学基金重点项目{国家外汇储备的多元化和国际资产配置模型) (70831∞1) ;国家自然科学基金面上项目
(Knight 不确定环境下的期权定价方法研究) (70671∞15)
作者简介:陶按平(1977 - ),女,首都经济贸易大学数最经济学博士研究生,首都经济贸易大学统计学院讲师:韩立绪。955 - ),
舅,北京航空航天大学经济管现学院教授,博士生导师。
67
二、娟和最大蛐原理
1.摘
铺(Entropy) 的概念起源于热力学,嗣后由香农 (Shannon) [1] 引入到信息论,作为基本的信息度量,
现在已经广泛应用到了很多领域。
定义(2) :设离散随机变最X 的分布列为p (X=X;) =PiO i=l , 2 , …, n , 则 X 的饷为:
H (X) =E [-lnp;] =币五 p;ln Pi (.1)
由于当m叶。时, xln x 趋于0 ,所以不妨规定OlnO=O,这也说明增加零概率事件不会改变腐。
设连续随机变量X 的概率密度为f ( 忡,则定义X 的蛐为:
H (X) =E,[ 哺卜们)ln 忡忡 (2)
连续随机变量X 的销也称为连锁分布f (x) 的铺(或微分峭) ,记为Hω。由于规定Oln 0 =0 ,定
文档评论(0)