从助理到双重代理:对个性化本地人工智能代理的O
penCLAW攻击进行形式化和基准测试。
尽管以OpenClaw为代表的基于大语言模型(LLM)的代理正逐渐从面向任
务的系统发展为用于解决复杂现实世界任务的个性化人工智能助手,但它
们的实际部署也带来了严重的安全风险。然而,现有的代理安全研究和评
估框架主要侧重于综合或以任务为中心的设置,因此无法准确捕获现实部
署中个性化代理的攻击面和风险传播机制。为了解决这一差距,我们提出
了个性化代理安全基准(PASB),这是一种专为现实世界的个
从助理到双重代理:对个性化本地人工智能代理的O
penCLAW攻击进行形式化和基准测试。
尽管以OpenClaw为代表的基于大语言模型(LLM)的代理正逐渐从面向任
务的系统发展为用于解决复杂现实世界任务的个性化人工智能助手,但它
们的实际部署也带来了严重的安全风险。然而,现有的代理安全研究和评
估框架主要侧重于综合或以任务为中心的设置,因此无法准确捕获现实部
署中个性化代理的攻击面和风险传播机制。为了解决这一差距,我们提出
了个性化代理安全基准(PASB),这是一种专为现实世界的个
文档评论(0)