博弈中的学习机制问题.pptVIP

下载本文档

9
0
约4.03千字
约 23页
2017-08-10 发布于北京
举报
版权申诉

博弈中的学习机制问题.ppt

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈中的学习机制问题　　一：归纳和演绎　　二：行动中的两种推理：归纳与演绎　　三：酒吧问题　　四、少数者博弈及其应用：　　　　　　　　—股票买卖与交通拥挤问题　　五、对称的人群为什么会出现破缺性的行动　　　　　　　　　　　　　　　　　　　　　——盲目的学习一：演绎推理和归纳推理１、演绎推理：是由某个普遍性的原理推出某种特殊的结论（三段论）　大前提：“所有人皆要死”；小前提：“张三是人”；结论：“张三要死”。　　只要前提真，推理过程无误，演绎推理的结论就是真的。　　演绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论其内容不会超过前提蕴涵的内容。２、归纳推理　　由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。前提1：张三要死；前提2：李四要死；结论：所有人都死。　　归纳出来的普遍性的结论不是必然真的，而是归纳真的，或者说是“或然真的”。　即：结论可能是真的，也可能是假的。３、归纳法的问题（１）归纳法是跳跃的。（２）归纳法是人们的习惯联想（甲现象--乙现象）——但是不一定合理。（３）归纳法是一种有用的思维工具，但不是时时有效。（４）归纳法存在困境，其合理性会受到质疑。（５）归纳法在现实生活中到处可见。　　　　　　如何用归纳法对人的行动进行归纳，决定自己的行动的　１、对事物规则性的归纳得出的结论叫规律，用归纳法来对人下结论。２、根据不同情况将进行分类。３、这样的归纳会发生错误，随着交往的深入，归纳会发生改变。这是个不完全信息动态博弈。　由于人们利用归纳法，在生活中就会形成均衡态：　周边的情况基本上被定了位，形成了固定的关系。所以现实生活一切从归纳开始，并且在不断的交往中对所归纳的看法给以改正。　　　这是一个博弈，在这个博弈中存在着一个对周边的人不断认识（不完全信息动态博弈）的过程，在博弈中称之为学习过程。二、行动中的两种推理：归纳与演绎　　博弈论是研究人的行为的，在博弈论中参与者一方面猜测其他参与者的策略，同时计算各种策略可能性下的支付（得益）。人们往往准备了各种备选策略，当其他参与者采取一确定策略时，自己将决定采取某种策略。（“人不犯我，我不犯人；人若犯我，我必犯人”）１、我们经常用逻辑推理的方法来确定自己的行动；逻辑是社会行动的基础。（“如果天下雨，我将带伞”）前提1：如果天下雨，我将带伞前提2：今天下雨；结论；我要带伞。　　这是一个演绎推理２、逻辑推理在社会行动中是确定策略的工具。　　参与者在计算支付时，也是一样确定自己的策略，即确定：一旦别人采取什么策略，我将采取什么支付更大——策略更好２、行动中的逻辑推理与认识中的逻辑推理的关系（１）在行动的推理中只要前提是真的，推理形式正确，结论肯定是真的。这与认识中的逻辑推理是一样的。（２）人们的行动中的推理前提其正确性如何呢（是由行动者根据自身的利益来决定的）行动的正确性是由行动者的理性与行动结构所决定的。　　　　就博弈来说，这个结构就是博弈的结构。一旦行动者的结构给定了，理性的行动者的策略决定就确定了。　　对于日常非博弈的情况，理性的行动者总是最大化自己的利益制定策略的。三、酒吧问题　　有一群人，例如总共有１００人，每个周末，均要决定是去一洒吧活动还是呆在家里。酒吧的容量是有限的，比如空间是有限的或者座位是有限的，如果人去多了，去酒吧的人会感到不舒服，此时，他们留在家里比去酒吧更舒服。我们假定酒吧容量是６０人．或者说座位是６０个，如果某人预测去酒吧的人数超过６０人，他的决定是不去，反之则去。这１００人如何作出去还是不去的决策呢? １、这是一个不完全信息动态博弈，人们根据以前去酒吧的人的不完全的信息来作出一个去与不去的决策。２、对博弈的参与者来说。问题是他如何才能归纳（预测）出合理的行动策略。３、经过一段时间．这个系统中的人群去与不去的人数之比是60：40，形成一个生态稳定系统。４、如何解释（１）混沌现象（２）非线性过程非线性的过程是说，系统未来对初始值有强烈的敏感性。（“蝴蝶效应”）（３）推理过程　　　　酒吧问题中，假如其中一个人对未来的人数作出了一个预测而决定第n天去还是不去，他的行为反映在下次去酒吧的人数上，这个数目对其他人的预测及第n＋1天去和不去的决策造成影响，即第n＋1天中去酒吧的人数中含有他第n天的决策的影响。而他对第n＋2天人数的预测要根据第n＋l天的人数，这样，他第n天的预测及行为给其他人造成的影响反过来又对他第n+2天的行为造成影响。