AI大模型-第一章-初识智能体.pdfVIP

下载本文档

1
0
约2.57万字
约 22页
2025-11-19 发布于湖南
举报
版权申诉

AI大模型-第一章-初识智能体.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第⼀章初识智能体

（前沿热点开源项⽬⼀：helloagent：/datawhalechina/Hello-Agents

tab=readme-ov-file）

第⼀章初识智能体

欢迎来到智能体的世界！在⼈⼯智能浪潮席卷全球的今天，智能体（Agent）已成为驱动技术变⾰与应

⽤创新的核⼼概念之⼀。⽆论你的志向是成为AI领域的研究者、⼯程师，还是希望深刻理解技术前沿

的观察者，掌握智能体的本质，都将是你知识体系中不可或缺的⼀环。

因此，在本章，让我们回到原点，⼀起探讨⼏个问题：智能体是什么？它有哪些主要的类型？它⼜是

如何与我们所处的世界进⾏交互的？通过这些讨论，希望能为你未来的学习和探索打下坚实的基础。

图1.1智能体与环境的基本交互循环

1.1什么是智能体？

在探索任何⼀个复杂概念时，我们最好从⼀个简洁的定义开始。在⼈⼯智能领域，智能体被定义为任

何能够通过传感器（Sensors）感知其所处环境（Environment），并⾃主地通过执⾏器

（Actuators）采取⾏动（Action）以达成特定⽬标的实体。

这个定义包含了智能体存在的四个基本要素。环境是智能体所处的外部世界。对于⾃动驾驶汽⻋，环

境是动态变化的道路交通；对于⼀个交易算法，环境则是瞬息万变的⾦融市场。智能体并⾮与环境隔

离，它通过其传感器持续地感知环境状态。摄像头、克⻛、雷达或各类应⽤程序编程接⼝

（ApplicationProgrammingInterface,API）返回的数据流，都是其感知能⼒的延伸。

获取信息后，智能体需要采取⾏动来对环境施加影响，它通过执⾏器来改变环境的状态。执⾏器可以

是物理设备（如机械臂、⽅向盘）或虚拟⼯具（如执⾏⼀段代码、调⽤⼀个服务）。

然⽽，真正赋予智能体智能的，是其⾃主性（Autonomy）。智能体并⾮只是被动响应外部刺激或严

格执⾏预设指令的程序，它能够基于其感知和内部状态进⾏独⽴决策，以达成其设计⽬标。这种从感

知到⾏动的闭环，构成了所有智能体⾏为的基础，如图1.1所⽰。

1.1.1传统视⻆下的智能体

在当前⼤语⾔模型（LargeLanguageModel,LLM）的热潮出现之前，⼈⼯智能的先驱们已经对“智能

体”这⼀概念进⾏了数⼗年的探索与构建。这些如今我们称之为“传统智能体”的范式，并⾮单⼀的

静态概念，⽽是经历了⼀条从简单到复杂、从被动反应到主动学习的清晰演进路线。

这个演进的起点，是那些结构最简单的反射智能体（SimpleReflexAgent）。它们的决策核⼼由⼯程

师明确设计的“条件-动作”规则构成，如图1.2所⽰。经典的⾃动恒温器便是如此：若传感器感知的

室温⾼于设定值，则启动制冷系统。

这种智能体完全依赖于当前的感知输⼊，不具备记忆或预测能⼒。它像⼀种数字化的本能，可靠且⾼

效，但也因此⽆法应对需要理解上下⽂的复杂任务。它的局限性引出了⼀个关键问题：如果环境的当

前状态不⾜以作为决策的全部依据，智能体该怎么办？

图1.2简单反射智能体的决策逻辑⽰意图

为了回答这个问题，研究者们引⼊了“状态”的概念，发展出基于模型的反射智能体（Model-Based

ReflexAgent）。这类智能体拥有⼀个内部的世界模型（WorldModel），⽤于追踪和理解环境中那些

⽆法被直接感知的⽅⾯。它试图回答：“世界现在是什么样⼦的？”。例如，⼀辆在隧道中⾏驶的⾃

动驾驶汽⻋，即便摄像头暂时⽆法感知到前⽅的⻋辆，它的内部模型依然会维持对那辆⻋存在、速度

和预估位置的判断。这个内部模型让智能体拥有了初级的“记忆”，使其决策不再仅仅依赖于瞬时感

知，⽽是基于⼀个更连贯、更完整的世界状态理解。

然⽽，仅仅理解世界还不够，智能体需要有明确的⽬标。这促进了基于⽬标的智能体（Goal-Based

Agent）的发展。与前两者不同，它的⾏为不再是被动地对环境做出反应，⽽是主动地、有预⻅性地选

择能够导向某个特定未来状态的⾏动。这类智能体需要回答的问题是：“我应该做什么才能达成⽬

标？”。经典的例⼦是GPS导航系统：你的⽬标是到达公司，智能体会基于地图数据（世界模型），

通过搜索算法（如A*算法）来规划（Planning）出⼀条最优路径。这类智能体的核⼼能⼒体现在了对

未来的考量与规划上。

更进⼀步，现实世界的⽬标往往不是单⼀的。我们不仅希望到达公司，还希望时间最短、路程最省油

并且避开拥堵。当多个⽬标需要权衡时，基于效⽤的智能体（Utility-BasedAg

您可能关注的文档

文档评论（0）

Jane9872 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

AI大模型-第一章-初识智能体.pdfVIP