AI大模型-第一章-初识智能体.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第⼀章初识智能体

(前沿热点开源项⽬⼀:helloagent:/datawhalechina/Hello-Agents

tab=readme-ov-file)

第⼀章初识智能体

欢迎来到智能体的世界!在⼈⼯智能浪潮席卷全球的今天,智能体(Agent)已成为驱动技术变⾰与应

⽤创新的核⼼概念之⼀。⽆论你的志向是成为AI领域的研究者、⼯程师,还是希望深刻理解技术前沿

的观察者,掌握智能体的本质,都将是你知识体系中不可或缺的⼀环。

因此,在本章,让我们回到原点,⼀起探讨⼏个问题:智能体是什么?它有哪些主要的类型?它⼜是

如何与我们所处的世界进⾏交互的?通过这些讨论,希望能为你未来的学习和探索打下坚实的基础。

图1.1智能体与环境的基本交互循环

1.1什么是智能体?

在探索任何⼀个复杂概念时,我们最好从⼀个简洁的定义开始。在⼈⼯智能领域,智能体被定义为任

何能够通过传感器(Sensors)感知其所处环境(Environment),并⾃主地通过执⾏器

(Actuators)采取⾏动(Action)以达成特定⽬标的实体。

这个定义包含了智能体存在的四个基本要素。环境是智能体所处的外部世界。对于⾃动驾驶汽⻋,环

境是动态变化的道路交通;对于⼀个交易算法,环境则是瞬息万变的⾦融市场。智能体并⾮与环境隔

离,它通过其传感器持续地感知环境状态。摄像头、克⻛、雷达或各类应⽤程序编程接⼝

(ApplicationProgrammingInterface,API)返回的数据流,都是其感知能⼒的延伸。

获取信息后,智能体需要采取⾏动来对环境施加影响,它通过执⾏器来改变环境的状态。执⾏器可以

是物理设备(如机械臂、⽅向盘)或虚拟⼯具(如执⾏⼀段代码、调⽤⼀个服务)。

然⽽,真正赋予智能体智能的,是其⾃主性(Autonomy)。智能体并⾮只是被动响应外部刺激或严

格执⾏预设指令的程序,它能够基于其感知和内部状态进⾏独⽴决策,以达成其设计⽬标。这种从感

知到⾏动的闭环,构成了所有智能体⾏为的基础,如图1.1所⽰。

1.1.1传统视⻆下的智能体

在当前⼤语⾔模型(LargeLanguageModel,LLM)的热潮出现之前,⼈⼯智能的先驱们已经对“智能

体”这⼀概念进⾏了数⼗年的探索与构建。这些如今我们称之为“传统智能体”的范式,并⾮单⼀的

静态概念,⽽是经历了⼀条从简单到复杂、从被动反应到主动学习的清晰演进路线。

这个演进的起点,是那些结构最简单的反射智能体(SimpleReflexAgent)。它们的决策核⼼由⼯程

师明确设计的“条件-动作”规则构成,如图1.2所⽰。经典的⾃动恒温器便是如此:若传感器感知的

室温⾼于设定值,则启动制冷系统。

这种智能体完全依赖于当前的感知输⼊,不具备记忆或预测能⼒。它像⼀种数字化的本能,可靠且⾼

效,但也因此⽆法应对需要理解上下⽂的复杂任务。它的局限性引出了⼀个关键问题:如果环境的当

前状态不⾜以作为决策的全部依据,智能体该怎么办?

图1.2简单反射智能体的决策逻辑⽰意图

为了回答这个问题,研究者们引⼊了“状态”的概念,发展出基于模型的反射智能体(Model-Based

ReflexAgent)。这类智能体拥有⼀个内部的世界模型(WorldModel),⽤于追踪和理解环境中那些

⽆法被直接感知的⽅⾯。它试图回答:“世界现在是什么样⼦的?”。例如,⼀辆在隧道中⾏驶的⾃

动驾驶汽⻋,即便摄像头暂时⽆法感知到前⽅的⻋辆,它的内部模型依然会维持对那辆⻋存在、速度

和预估位置的判断。这个内部模型让智能体拥有了初级的“记忆”,使其决策不再仅仅依赖于瞬时感

知,⽽是基于⼀个更连贯、更完整的世界状态理解。

然⽽,仅仅理解世界还不够,智能体需要有明确的⽬标。这促进了基于⽬标的智能体(Goal-Based

Agent)的发展。与前两者不同,它的⾏为不再是被动地对环境做出反应,⽽是主动地、有预⻅性地选

择能够导向某个特定未来状态的⾏动。这类智能体需要回答的问题是:“我应该做什么才能达成⽬

标?”。经典的例⼦是GPS导航系统:你的⽬标是到达公司,智能体会基于地图数据(世界模型),

通过搜索算法(如A*算法)来规划(Planning)出⼀条最优路径。这类智能体的核⼼能⼒体现在了对

未来的考量与规划上。

更进⼀步,现实世界的⽬标往往不是单⼀的。我们不仅希望到达公司,还希望时间最短、路程最省油

并且避开拥堵。当多个⽬标需要权衡时,基于效⽤的智能体(Utility-BasedAg

文档评论(0)

Jane9872 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档