我们称这整个感知的历史过程为感知序列.PPT

我们称这整个感知的历史过程为感知序列.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我们称这整个感知的历史过程为感知序列

第二章 智慧型代理人 2.1 簡介 2.2 代理人如何動作 2.3 智慧型代理人的結構 2.4 環境 2.1 簡介 1. 任何能夠以感測器去覺察環境,並且以作用器(effector)對環境作用的東西都可以稱為代理人。人類代理人有眼睛,耳朵,以及其他器官做為感測器,還有手,腳,嘴巴以及其他身體各部位做為作用器。 2. 一個機器代理人則是以相機及紅外偵測器做為感測器,並且有不同的馬達做為作用器。軟體代理人有編碼的位元字串來覺知及動作。 2.2 代理人如何動作 代理人如何動作(續) ? 可用績效衡量來當作決定代理人有多成功的準則。顯而易見的是的,沒有一種固定的衡量是適合所有代理人的。我們可以問問代理人對他們自己的績效的主觀滿意度,但是某些代理人是無法回答的,而有些代理人則是會自我欺騙的。 ~例子~ 假設一個情況是代理人要把髒地板用吸塵器掃乾淨,那麼八小時後檢查掃起來起來的灰塵量可以算是一個似乎合理的績效衡量方式,另一個比較做作的績效衡量方式是把耗電量和產生的噪音也一併考慮進來,第三種績效衡量的方式,也是要求最高的一種,則是要求代理人不只是安靜的、有效率的把地板打掃乾淨,週末還要空出時間來從事衝浪運動。 合理性及全知 ? 分辨『合理性』(rationality)及『全知』(omniscience)的不同要非常地小心。全知的代理人知道動作的實際代價,並且能夠據此決定其行動。但在真實環境中全知是不可能的。由以下例子可得知,『合理性』僅關心那些假設已覺察到、預期中的成功。因為在大多數時間中,過街是會成功的,因此過街是合理的,而且我毫無辦法預知貨艙門會掉下來。 ~例子~ 有一天我沿著香榭麗大道行走時,看到一個老朋友過街,附近沒有車子而且我也不趕時間,所以,很合理的,我開始過街。此時,在高度三萬三千英尺外,一架飛行中的大型客機貨艙門掉落下來,在我過到街對面之前我就被壓平了。 合理性及全知(續) 簡而言之,任何一個給定的時間裡,所謂的合理,和下列四件事相關: ◆ 定義成功度的效能衡量。 ◆ 到目前為止代理人覺察到的每一件事。 ◆ 我們稱這整個感知的歷史過程為感知序列。 ◆ 代理人對環境的認識。 ◆ 代理人能夠執行的動作。 理想的合理性代理人 定義:   對於每一個可能的感知序列,一個理想的合理性代理人,應該在感知序列提供的證據及代理人任何內建知識的基礎上,執行任何預期能夠使績效衡量結果最佳化的動作。 理想對應 1. 一旦我們瞭解到代理人的行為和他目前的感知序列相關,則我們只要列出代理人回應每一個可能的感知序列所採取的行動表,就可以來描述任何一個特定代理人。這樣子的表格稱之為從感知序列到動作的對應。 2. 徹底檢討所有可能的感知序列及記錄代理人回應的動作,並找出能夠正確描述代理人的對應。對應可以說明代理人,而理想的對應就描述了理想的代理人。 理想對應(續) 3. 一個明確的列表,可以用登記每一個可能的感知序列。理想的對應是,當感知是一個正數x時,正確的動作是顯示出一個正數z使得z2~x,精確度到,舉例來說,小數點下十五位。這個理想對應的說明並不要求設計者實際建立一個方根表,而開方根功能也不需要使用方根表來正確動作:圖2.2表示了部分的理想對應,以及執行使用牛頓法的對應的一個簡單程式。 理想對應表 理想對應表(續) 開方根的例子說明了對於非常受限制的任務下,理想對應和理想代理人設計之間的關係。當表格非常大時,代理人是好的、簡潔的程式。結果是,要設計一個在更一般情況下來執行理想對應的好的、簡潔的代理人是可行的:在無限多樣化的環境下,能夠解決無限多樣化任務的代理人。在我們討論怎樣做之前,還需要再看另一個代理人應該滿足的要求。 自治灌 理想合理性代理人還有另一個的定義:就是『內建知識』這個部分。如果代理人的行動完全基於內建知識,而完全不注意感知,則我們說這個代理人缺乏自治權。 ~例子~ 假如鐘錶製造商有先見之明,預知錶主將在某特定日子前往澳洲,則可以在錶內內建一個機制,在那個時間自動把時針調整六個小時。這將是相當成功的動作,但是智慧性看起來是屬於錶的設計人而非錶本身。 2.3 智慧型代理人的結構 l 目前為此我們談到代理人,都是在描述他們的行為-在任何給定的感知序列下執行的動作,現在,我們要去掉外殼看看裡面是如何運作的。人工智慧的工作是設計代理人程式:實現使代理人從感知到動作相符的功能。假設程式會執行某些類找們稱之為結構的計算元件,很明顯的,我們選的程式必須是結構能接受而且能執行的。 代理人,結構和程式三者之間的關係如下所示: 代理人=結構+程式 l 在設計代理人程式之前,對於可能的感知和動作,代理人預期達成的目標或

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档