纳殊均衡NashEquilibrium.ppt

下载文档 降价啦

9
0
约8.32千字
约 82页
2018-06-05 发布于天津
举报
版权申诉
保障服务

纳殊均衡NashEquilibrium.ppt

1、本文档共82页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

纳殊均衡NashEquilibrium

內容約翰 ? 納殊(John Nash)的生平。博弈論(Game Theory)淺介。納殊贏得諾貝爾獎的理論。納殊理論的影響力。當納殊申請普林斯頓大學研究院時，他的老師為他所寫的推介信只有一行字：「此人是天才！」(This man is a genius)。什麼是博弈論? Game Theory : 遊戲理論、賽局論、對策論、博弈論。 Game : 遊戲、賽局、博弈。什麼是博弈論? 博弈論嘗試為決策者之間的衝突與合作建立數學模型。它研究每一個決策者將如何根據其他對手的策略，去作出最有利自己的策略。博弈論與經濟學博弈論研究人們如何根據其他對手的策略，去作出最有利自己的策略。由於經濟活動往往涉及策略的運用，博弈論因而大派用場。報章減價戰蘋果日報與東方日報正考慮應否減價。兩報可分別選擇減價或不減價。假設兩報都不減價，則各可賺取二千萬。若己方減價而對手不減價，則己方可賺取三千萬而對手則只能賺到五百萬。若兩報同時減價，則各可賺取一千萬。疑犯困境 (Prisoner’s Dilemma) 甲與乙被警方以藏械罪名拘捕。警方懷疑他們正準備持械行劫。兩人被單獨囚禁和盤問。如果二人都承認意圖行劫，每人將被判入獄三年。如果他們都不承認，則各判入獄一年。如果一人否認而另一人承認，並且願意作證，那否認者將被判入獄五年，而承認者則可獲釋放。兩例的共同點有兩個參與者，A 和 B。每個參與者都有兩個策略， C 和D。共有四個策略組合： (C, C) , (C, D) , (D,C), (D, D) 。雙方都知道各策略組合的得失。參與者 A 和 B 根據各決策組合的得失，得到以下決策組合的優先次序。何謂博弈? 前兩例都是博弈論 (Game Theory)裏博弈(Game) 的例子。每個博弈(Game)是由以下四個條件來界定。博弈的界定參與者的數目。參與者各自可選擇的全部策略。所有可能出現的策略組合。各參與者在每個策略組合的得失。博弈的解 (Solution of a game) 對每一個博弈，我們都希望知道每個參與者將如何決策。所有參與者的最後決策便構成博弈的解 (solution of a game) 。試找出「疑犯困境」的解。上策 (Dominant Strategy) 無論其他對手怎樣選擇，這個策略給某參與者帶來的得益，都比任何其他策略為高。乙和甲的上策都是認罪。若乙與甲都是理性的，則他們都會選擇認罪。博弈的解(結果) 上策均衡(Dominant Strategy Equilibrium) 如果每個參與者都有一個上策，則他們都會選擇其上策，我們因而得知博弈的結果。如果每個參與者都選擇其上策，則這個策略組合稱為「上策均衡」。上策均衡處於「上策均衡」時，則每個參與者都不會改變自己的策略。如果一個博弈存在「上策均衡」，那麼每個參與者將依從這個均衡去作出選擇，我們因此可以推斷出他們的行為。上策均衡的存在馮 ? 諾伊曼証明了對一類特殊的二人博弈，「零和博弈」(zero-sum game) ，上策均衡必定存在。可是對大部份的博弈，上策均衡都不存在。當上策均衡都不存在時，我們應該怎麼辦呢? 數學裏類似的問題如果 p(a) = 0，則實數 a 是多項式 p(x)的根(root)，例如 1 是 p (x) = x2-2x+1的根。不是每個多項式都有實數根，例如 x2 + 4 便沒有實數根，這是因為對所有實數 x2 + 4 0 。解決這個問題的方法，是引進一種更加一般的數。這種數叫做複數(complex number)，例如：複數 a = 2i ( =2 ) 是 x2+4的一個根因為 (2i)2 = 4i2 = - 4。數學家高斯 (Gauss)証明：每一個非常數多項式都最少有一個複數根。尋找新解若我們的理論能推算出一個博弈的解 (結果) ，則這個解應該有什麼特性呢? 假設我們的理論能推算出參與者甲、乙和丙必會分別選擇策略 A, B 和 C。尋找新解試想像，如果甲知道乙和丙將會分別選擇 B 和 C ，那麼他會否不再選 A 呢? 如果我們的理論有效，甲依然會選擇 A 。同樣道理，如果其他人都不改變的話，乙和丙都不會改變各自的策略。納殊均衡(Nash Equilibrium) 一個策略組合稱為「納殊均衡」，如果所有參與者都不會獨自改變他們已選擇的策略。實例一：悶堂不早退在一個很沉悶的課堂上，學生可選擇早退或繼續留下聽課。為怕在老師心目中留下壞印象，所以沒有人希望自己成