人工智慧--chap18.pptVIP

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
18.3.7 擴大決策樹的適用性 為了將決策樹歸納法擴展到更廣泛而多樣的問題,必須提出一些考量。以下將對每一項作簡單的介紹,建議可經由作相關的習題以獲得完整的了解: 失落的資料(Missing data) 多值的屬性(Multivalued attributes) 連續和整數值的輸入屬性 (Continuous and integer-valued input attributes) 連續值的輸出屬性 (Continuous-valued output attributes) * 18.4 集體學習 * 18.5 為何學習可行:計算學習理論 學習代表表現得更好是經驗所造成的。之前已看到多種推論學習的演算法,並解釋過為何能適用於代理人。 基本原則如下:任何嚴重錯誤的假說幾乎在少量的實例之後必會有很高的機率被發現,因為它會造成不正確的預測。因此,任何與相當大的訓練集合一致的假說似乎不可能會有嚴重錯誤—也就是說,其必然十之八九逼近正確(Probably Approximately Correct)。 * 18.5.1 需要多少實例才夠? 圖18.12指出所有假說的集合H,分割為環繞f和其餘函數的?-球,稱為Hbad。 * 18.5.2 決策表學習 一個決策表(decision list)是一種限制形態的邏輯表示法。決策串列由一系列測試所組成,其中每一項都是文字的聯結。 圖18.13顯示一個表現假說的決策表,由之前的CURRENT-BEST-LEARNING演算法所獲得: ?x WillWait(x) ? Patrons(x, Some) ? (Patrons(x, Full) ? Fri/Sat(x)) * 18.5.2 決策表學習 * 18.5.2 決策表學習 我們將使用一個稱為DECISION-LIST-LEARNING的貪婪演算法,可重複地找出一項恰與訓練集合中某些子集合一致的測試。一旦找出這樣的一項測試,就將它加入建構中的決策串列,並移除相關的實例。接著用剩下的實例建構其餘的決策串列。這個程序一直重複,直到沒有實例剩下。演算法列於圖18.14。 * 18.5.2 決策表學習 圖18.15 這張圖表示DECISION-LIST-LEARNING演算法對餐廳資料的預測效能,是可見實例數量的函數。DECISION-TREE-LEARNING的曲線被列出作為比較。 * 討論 計算學習理論以產生一種檢視學習問題的新方法。在1960年代早期,學習理論專注於有限制的確認(identification in the limit)。確認演算法必須傳回一個確實符合真值函數的假說。標準方法是結合目前最佳假說和版本空間的方法:目前最佳假說是假說空間在某種固定的簡化順序下,第一個一致性假說。 * * 人工智慧導論 高 宗 萬 北台灣科學技術學院 電 子 工 程 系 第18章 從觀察中學習 18.1 學習的形式 18.2 歸納學習法 18.3 學習決策樹 18.4 集體學習 18.5 為何學習可行:計算學習理論 18.6 小結 * 18.1 學習的形式 一個具有學習特性的代理人,在概念上可分解為如圖 2.15 所示的四項元件。其中最重要的是區分負責改善內部效能的學習單元,和負責選擇外在行動的執行單元。之前被當成是完整代理人的部份即是一個執行單元;它能取得認知並決定行動。 * * 學習單元的設計受到3個主要關鍵問題的影響: 執行單元的哪一個元件(components)需要學習。 學習這些元件能得到哪些回饋(feedback)。 這些元件的表示方法為何 ? * 代理人的組成元件 一個從目前狀態的條件到行動的直接對應。 一種從感知序列中推斷世界相關屬性的方法。 世界發展方式,以及代理人可能採取的行動而導致的結果之資訊。 作這些行動的渴望程度之效用(utility)資訊。 作這些行動的渴望程度之行為-價值(action-value)資訊。 目標(goal)是描述一群狀態的類別使得代理人能達到最大效用。 * 機器學習類型 受監督的學習(supervised learning) 無監督的學習(unsupervised learning) 增強學習(reinforcement learning) * 元件的表示方法 這些元件中的任何一種都可以用本書介紹的表示法表示。已有許多個例子:決定性敘述法,例如競局程式中效能函數的線性加權多項式,和邏輯代理人各元件的比例項(proportional)與一階邏輯敘述;以及機率描述,例如用於決策理論代理人推論元件的信念網路。 * 18.2 歸納學習法 在控制學習之中,學習單元被給定對應於特定

文档评论(0)

advs728 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档