第十六章进行简单的决策精品课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十六章进行简单的决策精品课件

第十六章 進行簡單決策 16.1 在不確定的情況下結合信念與希望 16.2 功能理論基礎 16.3 功效函數 16.4 多重屬性的功效函數 16.5 決策網路 16.6 資訊的價值 16.7 決策理論專家系統 16.1 在不確定的情況下結合信念與希望 近來在理科的教科書上越來越常談到功效(utility)而非良善或邪惡,但原則仍相同。功效函數(utility function)擷取代理人對這整個世界狀態的偏好,功能函數則用單一的數字表現一個狀態的好處。為了要給每項行為一個預期功效,所以要結合行為的功效與結果機率。 最大預期功效(MEU, maximum expected utility)原則指出一個推論代理人應該選擇會使代理人的預期功效為最大的行為。 就某方面而言,MEU原則像是為所有AI下定義。一個智慧代理人所要做的事就是計算不同的值,使其行為達到最大限度,然後離開。但這並不表示所有AI的問題已被這個定義解決了! 16.2 功能理論基礎 最大預期功效(Maximum Expected Utility,MEU)原則似乎是一個用於做決策的合理方法,但明顯地它並非唯一合理的方法。畢竟,為什麼將平均功效最大化有這麼特殊—為何不是把可能功效的立方總和最大化,或試著最小化最壞可能損失? 理性喜好的限制 這些問題能藉著寫下一些對於理性代理人喜好的限制而得到解答,同時證明MEU原理可從這些限制推導。寫下這些限制是一種從語意上定義喜好的方法。觀念上,對個別細微的狀態給于喜好,則該理論可用於推導複雜決策劇本(scenario)的喜好結果。如同複雜邏輯敘述句的真值可由其中各元素定義的真值推導,以及複雜事件的機率是由單一事件(atomic event)的機率推導。 下列六種限制被視為功能理論的原理,為喜好和彩券定義最明顯的語意限制。 有序性(Orderbility) 遞移性(Transitivity) 連續性(Continuity) 替代性(Substitutability) 單調性(Monotonicity) 解構性(Decomposability) …然後有功效 功效理論的原理並非對於功效的完整說明,而是只談論到喜好。喜好被認定是理性代理人的基本特性。功效函數的存在衍生自功效原理︰ 1.功效原則(Utility principle) 2.最大預期功效原則 (Maximum Expected Utility principle) 16.3 功效函數 功效是一個從狀態對應到真實值的函數。然而這就是功效函數嗎?嚴格來說,沒錯。除了稍早列出的限制之外,代理人可以有任何喜好。例如,一個代理人可能偏好銀行帳戶裡的金額為質數;在這個例子裡,若帳戶裡有16元就捨棄3元。也可能較偏好一部有凹痕的1973年福特Pinto,而非一輛嶄新的賓士。喜好也能互相影響。 金錢的功效 功效理論有其經濟學上的根源,而經濟學提供一個觀察功效評估的條件︰金錢(或更明確,一個代理人的總資產)。金錢幾乎是全球通用,可用來換取任何商品和服務,可知金錢在人類功能函數中扮演一個重要的角色。 我們不該認定這是金融值的確定功效函數,但似乎大多數人在有正資產時的功效函數是凹形曲線。負債通常被視為是一種遺憾,但對於不同負債程度的喜好會顯現出與正資產相對應的反轉曲線。例如,一個負債一千萬美金的人很可能接受有公正硬幣與一千萬彩金的賭局,若正面向上就可贏得一千萬,若反面向上就輸兩百萬。產生如圖16.1(b)的S形曲線。 圖16.1 功效等級與功效評定 即使已知代理人的喜好行為,功效原理也不能為代理人定義個別的功效函數。很容易發現使用下列功效函數的代理人會與使用U(S)的代理人有相等的行為,表示他們有相同的信念: U’(S) = k1 + k2U(S) 評估功效的一項共同程序建立一個”最佳可能獎金”的等級(scale),以U(S)=u┬表示。以及一個以U(S)=u?表示的”最差可能結果”。標準化功效(normalized utilities)的等級中,u?=0,u┬=1。 人類判斷力與不可靠性 決策理論是一個規範立論:說明理性的代理人應該怎麼做。若經濟理論同時也是一種描述實際人類決策過程的理論,擇期應用將可大幅度改進。 16.4 多重屬性的功效函數 做決策屬於公共政策領域,動輒包含數以百萬計的金錢和生死。例如,決定讓何種程度的致癌物質進入環境中,決策者必須斟酌死亡的預防以及因為排除某些產品和程序所造成的經濟困境。諸如此類。這類問題的結果可用兩種或更多的屬性將其特徵化(characterized),並用多屬性功效理論(multiattri

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档