- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论的诡计读后感 博弈论读后感_0
博弈论的诡计读后感 博弈论读后感
博弈论读后感(一)
博弈小术语:收益矩阵、均衡、纳什均衡、零和博弈论,也称互动的决策论。它的基本假设之一是人是理性的。但现实并非如此,人不可能具有完备的知识也不可能时时理性。尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。
每一次的人际交往都可以简化成两个基本选择:合作或背叛。比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。当一次性博弈出现时,人们往往会选择背叛。这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢,因为它知道候机的乘客不会是它的长期客户。而当博弈的终点不可知时,就又是另一回事了。
在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。
当然,如果在开头就有一些善意的人出来表明合作态度对提高合作机会也是有帮助的,不管这些善意的人是出于何种目的。一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。至于时间的长短,关键是看博弈的终点是否明确。这在上面
也提到了,如果终点明确,人们就会倾向于在最后一次背叛。而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。如此反复推演,合作从一开始就很难形成。注意上面的论述是基于没有惩罚机制的基础。
有一个很有意思的实验,是由爱克斯罗德完成的。这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。结果表明,前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是一报还一报策略。
这个实力不凡的一报还一报策略就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。这种策略体现的是善良、可激怒、宽容、简单等好品质。虽然该策略在每次对局中分数都不能超过对手,但它的总分却是最高的。它赖以生存的基础很牢固。而那个非善意程序的成功是建立在别人的失败之上。可以想像,如果赋予这些程序以进化的基因,久而久之,非善意程序的存活率将下降。
博弈论读后感(二)
我阅读的书是《博弈论教程》,王则柯、李杰编着,中国人民大学出版社。此书一共分为九章,我自学了前七章,总结了一下学习心得。
博弈大致有以下两种分类:按照博弈各方是否同时决策可以
分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。
同时决策博弈
纳什均衡:局中人单独改变策略不会得到好处的对局即策略组合,就是纳什均衡。设是人博弈的一个策略组合。如果对于每个局中人,,对于所有的都成立,则我们称策略组合是该博弈的一个纳什均衡。
优势策略有严格优势策略和弱优势策略之分,可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。
混合策略纳什均衡
对于有时候纳什均衡不是唯一的,有时候纳什均衡是不存在的,按照上述方法寻找博弈的结果有时候不能实现,所以需要展开纳什均衡。
混合策略与纯策略的区别在于,混合策略是局中人可以按照一定的概率,随机的从策略组合中选择一种纯策略作为实际的行动。
混合策略:有一个有N个局中人参与的策略式博弈中,假定
局中人有个纯策略,即则概率分布,其中,,称为局中人的一个混合策略,这里表示局中人选择纯策略的概率。
混合策略纳什均衡:是指给定对方选择该相对最优混合策略的条件下,能使局中人自身的期望支付达到最大的混合策略,必须满足的条件如下:
利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。
帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。
序贯决策博弈
序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈
您可能关注的文档
- 学生篮球运动会运动员安全责任书.doc
- 小学版画校本课程教学设计.doc
- 湖泊富营养化治理方法.doc
- 技术交底瓦工.doc
- 本田汽车外观件标准中文版HES2003中文.doc
- 入党积极分子小结.doc
- 人教版六年制小学语文一年级上册期末试卷.doc
- 四年级下册英语全部教案{可作听课记录}.doc
- 辽宁省危险化学品登记工作指南(试行).doc
- [宝典]瓦工的验收标准.doc
- 实验室危废随意倾倒查处规范.ppt
- 实验室危废废液处理设施规范.ppt
- 实验室危废处置应急管理规范.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第20课时 中国的地理差异.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第21课时 北方地区.ppt
- 危险废物处置人员防护培训办法.ppt
- 危险废物处置隐患排查技术指南.ppt
- 2026部编版小学数学二年级下册期末综合学业能力测试试卷(3套含答案解析).docx
- 危险废物处置违法案例分析汇编.ppt
- 2026部编版小学数学一年级下册期末综合学业能力测试试卷3套精选(含答案解析).docx
原创力文档


文档评论(0)