纳殊均衡NashEquilibrium.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
纳殊均衡NashEquilibrium

內 容 約翰 ? 納殊(John Nash)的生平。 博弈論(Game Theory)淺介。 納殊贏得諾貝爾獎的理論。 納殊理論的影響力。 當納殊申請普林斯頓大學研究院時,他的老師為他所寫的推介信只有一行字:「此人是天才!」(This man is a genius)。 什麼是博弈論? Game Theory : 遊戲理論、賽局論、 對策論、博弈論。 Game : 遊戲、賽局、博弈。 什麼是博弈論? 博弈論嘗試為決策者之間的衝突與合作建立數學模型。 它研究每一個決策者將如何根據其他對手的策略,去作出最有利自己的策略。 博弈論與經濟學 博弈論研究人們如何根據其他對手的策略,去作出最有利自己的策略。 由於經濟活動往往涉及策略的運用,博弈論因而大派用場。 報章減價戰 蘋果日報與東方日報正考慮應否減價 。 兩報可分別選擇減價或不減價。 假設兩報都不減價,則各可賺取二千萬。 若己方減價而對手不減價,則己方可賺取三千萬而對手則只能賺到五百萬。 若兩報同時減價,則各可賺取一千萬。 疑犯困境 (Prisoner’s Dilemma) 甲與乙被警方以藏械罪名拘捕。警方懷疑他們正準備持械行劫。兩人被單獨囚禁和盤問。 如果二人都承認意圖行劫,每人將被判入獄三年。 如果他們都不承認,則各判入獄一年。 如果一人否認而另一人承認,並且願意作證,那否認者將被判入獄五年,而承認者則可獲釋放。 兩例的共同點 有兩個參與者,A 和 B。 每個參與者都有兩個策略, C 和D。 共有四個策略組合: (C, C) , (C, D) , (D,C), (D, D) 。 雙方都知道各策略組合的得失。 參與者 A 和 B 根據各決策組合的得失, 得到以下決策組合的優先次序。 何謂博弈? 前兩例都是博弈論 (Game Theory)裏博弈(Game) 的例子。 每個博弈(Game)是由以下四個條件來界定。 博弈的界定 參與者的數目。 參與者各自可選擇的全部策略。 所有可能出現的策略組合。 各參與者在每個策略組合的得失。 博弈的解 (Solution of a game) 對每一個博弈,我們都希望知道每個參與者將如何決策。 所有參與者的最後決策便構成博弈的解 (solution of a game) 。 試找出「疑犯困境」的解。 上策 (Dominant Strategy) 無論其他對手怎樣選擇,這個策略給某參與者帶來的得益,都比任何其他策略為高。 乙和甲的上策都是認罪。 若乙與甲都是理性的,則他們都會選擇認罪。 博弈的解(結果) 上策均衡 (Dominant Strategy Equilibrium) 如果每個參與者都有一個上策,則他們都會選擇其上策,我們因而得知博弈的結果。 如果每個參與者都選擇其上策,則這個策略組合稱為「上策均衡」。 上策均衡 處於「上策均衡」時,則每個參與者都不會改變自己的策略。 如果一個博弈存在「上策均衡」,那麼每個參與者將依從這個均衡去作出選擇,我們因此可以推斷出他們的行為。 上策均衡的存在 馮 ? 諾伊曼証明了對一類特殊的二人博弈,「零和博弈」(zero-sum game) ,上策均衡必定存在。 可是對大部份的博弈,上策均衡都不存在。 當上策均衡都不存在時,我們應該怎麼辦呢? 數學裏類似的問題 如果 p(a) = 0,則實數 a 是多項式 p(x)的根(root),例如 1 是 p (x) = x2-2x+1的根。 不是每個多項式都有實數根,例如 x2 + 4 便沒有實數根,這是因為對所有實數 x2 + 4 0 。 解決這個問題的方法,是引進一種更加一般的數。這種數叫做複數(complex number),例如: 複數 a = 2i ( =2 ) 是 x2+4的一個根因為 (2i)2 = 4i2 = - 4。 數學家高斯 (Gauss)証明:每一個非常數多項式都最少有一個複數根。 尋找新解 若我們的理論能推算出一個博弈的解 (結果) ,則這個解應該有什麼特性呢? 假設我們的理論能推算出參與者甲、 乙和丙必會分別選擇策略 A, B 和 C。 尋找新解 試想像,如果甲知道乙和丙將會分別選擇 B 和 C , 那麼他會否不再選 A 呢? 如果我們的理論有效, 甲依然會選擇 A 。 同樣道理,如果其他人都不改變的話,乙和丙都不會改變各自的策略。 納殊均衡(Nash Equilibrium) 一個策略組合稱為「納殊均衡」,如果所有參與者都不會獨自改變他們已選擇的策略。 實例一: 悶堂不早退 在一個很沉悶的課堂上,學生可選擇早退或繼續留下聽課。 為怕在老師心目中留下壞印象,所以沒有人希望自己成

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档