大语言模型通识微课课件：智能体和环境.pptx

下载文档

1
0
约2.51千字
约 14页
2024-10-12 发布于山东
举报
版权申诉
保障服务

大语言模型通识微课课件：智能体和环境.pptx

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、本文档共14页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

;智能体是人工智能领域中的一个很重要的概念，它指的是一个能自主活动的软件或者硬件实体。任何独立的能够思考并可以与环境交互的实体都可以抽象为智能体。

大模型在人工智能应用领域的重大突破，让人们看到了智能体新的发展机会。像ChatGPT和GPT-4这样的基于Transformer架构的大模型，成为了为智能体装备的拥有广泛任务能力的“大脑”，从推理、规划和决策到行动都使智能体展现出前所未有的能力。基于大模型的智能体将广泛深刻地影响人们生活工作的方式。;智能体通过传感器感知环境并通过执行器作用于该环境的事物。我们从检查智能体、环境以及它们之间的耦合，观察到某些智能体比其他智能体表现得更好，可以自然而然地引出理性智

能体的概念，即行为尽可能好。智

能体的行为取决于环境的性质。

图10-1智能体通过传感器和执行器与环境交互;一个人类智能体以眼睛、耳朵和其他器官作为传感器，以手、腿、声道等作为执行器。而机器人智能体可能以摄像头和红外测距仪作为传感器，各种电动机作为执行器。软件智能体接收文件内容、网络数据包和人工输入（键盘/鼠标/触摸屏/语音）作为传感输入，并通过写入文件、发送网络数据包、显示信息或生成声音对环境进行操作。环境可以是一切，甚至是整个宇宙。实际上，我们在设计智能体时关心的只是宇宙中某一部分的状态，即影响智能体感知以及受智能体动作影响的部分。;智能体这一概念主要作为分析系统的工具。理性智能体是做正确事情的事物。人工智能通常通过结果来评估智能体的行为。当智能体进入环境时，它会根据接受的感知产生一个动作序列，这会导致环境经历一系列的状态。如果序列是理想的，则智能体表现良好，这个概念由性能度量描述，评估任何给定环境状态的序列。;人类有适用于自身的理性概念，它与成功选择产生环境状态序列的行动有关，而这些环境状态序列从人类的角度来看是可取的。但是，机器没有自己的欲望和偏好，至少在最初，性能度量是在机器设计者或者机器受众的头脑中。一些智能体设计具有性能度量的显式表示，而在其他设计中，性能度量完全是隐式的，智能体可能会做正确的事情，但它不知道为什么。

应该确保“施以机器的目的是我们真正想要的”，但是正确地制定性能度量可能非常困难。例如，考虑真空吸尘器智能体，我们可能会用单个8小时班次中清理的灰尘量来度量其性能。然而，一个理性的智能体可以通过清理灰尘，然后将其全部倾倒在地板上，然后再次清理，如此反复，从而最大化这一性能度量值。更合适的性能度量是奖励拥有干净地板的智能体。例如，在每个时间步中，每个干净方格可以获得1分（可能会对耗电和产生的噪声进行惩罚）。作为一般规则，更好的做法是根据一个人在环境中真正想要实现的目标，而不是根据一个人认为智能体应该如何表现来设计性能度量。;在任何时候，理性取决于以下4方面：

（1）定义成功标准的性能度量；

（2）智能体对环境的先验知识；

（3）智能体可以执行的动作；

（4）智能体到目前为止的感知序列。

于是，对理性智能体的定义是：对于每个可能的感知序列，给定感知序列提供的证据和智能体所拥有的任何先验知识，理性智能体应该选择一个期望最大化其性能度量的动作。;需要区分理性和全知。全知的智能体能预知其行动的实际结果，并据此采取行动，但现实中这是不可能的，理性不等同于完美。理性使期望性能最大化，而完美使实际性能最大化。因此，对理性的定义并不需要全知，因为理性决策只取决于迄今为止的感知序列。

首先，考虑到这种缺乏信息的感知序列，过马路是不理性的：不观察路况就过马路发生事故的风险太大。其次，理性智能体在上街之前应该选择“观察”动作，因为观察有助于最大化期望性能。采取行动来改变未来的感知，有时被称为信息收集，这是理性的一个重要组成部分。;理性智能体不仅要收集信息，还要尽可能多地从它所感知到的东西中学习。智能体的初始配置反映对环境的一些先验知识，随着智能体获得经验，这可能会被修改和增强。在一些极端情况下，环境完全是先验已知和完全可预测的，这种情况下智能体只需要感知或学习，但这样的智能体是脆弱的。

一个理性的智能体应该学习如何弥补部分或不正确的先验知识。实际上，很少从一开始就要求智能体完全自主，除非设计者提供帮助，否则它将不得不随机行动。;构建理性智能体还必须考虑任务环境，它本质上是“问题”，而理性智能体是其“解决方案”。首先指定任务环境，然后展示任务环境的多种形式。任务环境的性质直接影响到智能体程序的恰当设计。

例如在讨论简单真空吸尘器智能体的理性时，必须为其指定性能度量、环境以及智能体的执行器和传感器（PEAS）描述，这些都在任务环境的范畴下。设计智能体时，第一步始终是尽可能完整地指定任务环境。;人工智能中可能出现的任务环境范围非常广泛。然而，我们可以确定少量的维度，并根据这些维度对任务环境进行分类。

完全可观测与部分可观

您可能关注的文档

文档评论（0）

ning2021 + 关注: 实名认证

内容提供者

中医资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

更多 >

大语言模型通识微课课件：智能体和环境.pptx