- 0
- 0
- 约2.38千字
- 约 6页
- 2026-01-20 发布于四川
- 举报
从零拆解一款火爆的浏览器自动化智能体,4步学会设计自主决策Agent
以前我们开发的大多数智能体是固定的工作流模式,很少有按照下面的框架,开发具有自主决策和自主使用工具的智能体。
?
?
前两天,我分享了一款可以自动使用浏览器完成简单任务的开源Agent——browser-use。
上面演示的是它自动搜索‘渡码’,并打开了我的博客。browser-use?是一款开源?Agent,在GitHub上有1.5wstar,一条命令就可以在本地安装使用,门槛非常低。
?
自从上次分享完之后,我的职业病就犯了,总想拆解一下看看是怎么实现的,所以就有了今天这篇文章。browser-use?只用了一条提示词完成了上面第一张图中Agent的四个模块——Memory、Planning、Tools和Action。这条提示词在源文件?prompts.py中,有130行
?
虽然提示词有点长,但不用担心,按照上面四个模块拆解完就会发现如此清晰、简单。
上面这段提示词是对四个模块的定义,下面我们一个一个来说。
?
Memory(记忆)?-?记录已经完成的任务和接下来要进行的任务。
memory:Descriptionofwhathasbeendoneandwhatyouneedtorememberuntiltheendofthetask,
我把上面‘打开博客’案例的执行过程记录了下来,可以看到Memory实际的栗子
memory:Baiduisopen,readytosearchfor渡码.
Planning(规划)-根据当前页面(网页)判断上一步执行是否成功,生成接下来应该执行的任务。
evaluation_previous_goal:Success|Failed|Unknown-Analyzethecurrentelementsandtheimagetocheckifthepreviousgoals/actionsaresuccessfullikeintendedbythetask.Ignoretheactionresult.Thewebsiteisthegroundtruth.Alsomentionifsomethingunexpectedhappenedlikenewsuggestionsinaninputfield.Shortlystatewhy/whynot,next_goal:Whatneedstobedonewiththenextactions
这里包含两部分,第一步是?evaluation_previous_goal判断之前任务是否成功,之前的任务是什么,可以在记忆中获取,这就解释了为什么第一张图中Memory有一条虚线指向Planning。
之前任务状态决定了下一个任务的规划,如果之前任务失败则重试,如果成功则规划新任务。
实际的栗子:
evaluation_previous_goal:Success-Baiduwassuccessfullyopenedinanewtab.,
next_goal:?Input?渡码?into?the?search?box?and?submit?the?search.
?
Tools(工具)-browser-use定义了15个可以操作网页的工具。
工具的定义会放在提示词中,以便大模型选择。每一个工具都有对应的代码用于完成具体的任务。
Action(行动)-?根据?Planning生成一系列具体的行动直接上栗子:
action:[{input_text:{index:12,text:渡码}},{click_element:{index:13}}]
这个例子中,有两个行动,第一步,在页面元素标号12的地方(搜索框)输入‘渡码’;第二步,在页面元素标号13的地方(搜索按钮)点击,完成搜索。
只不过巧合的是,在browser-use中所有Action都是用Tools完成。
有些朋友可能会有疑问,这些标号是怎么来的。
browser-use是通过分析页面HTML代码,识别出页面中的组件(元素),并给每个组件设置一个标号。?
在这个页面中,可以看到五颜六色的标记框和框上的标号,这就是browser-use识别的。
最终这些信息会转成‘1[:]aname=tj_settingicon设置/a’这种格式的文本,追加到提示词中,送入大模型
这样,大模型就能知道页面长什么样,从而可以规划任务。
我觉得这个思路非常值得学习,正是由于大模型具备强大的理解能力,才能
您可能关注的文档
- 25-26学年政治统编版必修4课件:5.2 社会历史的发展.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.2.2 尊重知识产权.pptx
- 25-26学年政治统编版必修4课件:6.3 价值的创造和实现.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:第1单元 第4课 知能双测8.pptx
- 重庆市西南大学附属中学2026届高三上学期12月月考 历史试卷(含答案).docx
- 安徽省皖南八校2026届高三上学期第二次大联考 政治试卷.docx
- 安徽省皖南八校2026届高三上学期第二次大联考 历史试卷.docx
- 25-26学年政治统编版必修4课件:5.1 社会历史的本质.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.3.2 有约必守 违约有责.pptx
- 湖北省部分高中2026届高三上学期二模联考 语文试卷.docx
- 25-26学年政治(部编版)选择性必修第二册课件:第1单元 周清1 民法中的人身权及财产权.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.4.1 权利保障 于法有据.pptx
- 2025北京丰台区高二(上)期中地理(A卷)含答案.docx
- 2025北京三帆中学初三(上)开学考英语试题含答案.docx
- 2025北京一零一中初三9月月考语文试题含答案.docx
- 2025北京海淀区初三(上)期中道法试题含答案.docx
- 2025北京丰台区高一(上)期中政治(A卷)含答案.docx
- 25-26学年政治统编版必修4课件:3.3 唯物辩证法的实质与核心.pptx
- 25-26学年政治统编版必修4课件:7.2 正确认识中华传统文化.pptx
- 湖北省部分高中2026届高三上学期二模联考 历史试卷.docx
最近下载
- 卧床病人翻身拍背操作规范.pptx VIP
- 对口畜牧单招题库及答案.doc VIP
- 2025-2026学年道法统编版小学五年级全册必背知识点归纳.docx VIP
- 2024-2025学年上海市静安区六年级上学期期末考试英语试卷含详解.pdf VIP
- 学堂在线 雨课堂 学堂云 工程伦理2.0 章节测试答案.docx VIP
- 《穿戴甲》标准文本.docx VIP
- 山东省潍坊市高密市2024-2025学年六年级上学期期末语文试题.docx VIP
- 学堂在线 雨课堂 学堂云 大数据机器学习 章节测试答案.docx VIP
- 代购走私责任边界.docx VIP
- 2022年人教部编版三年级语文上册期末考试卷及答案【真题】.doc VIP
原创力文档

文档评论(0)