Vercel 开源 Open Agents,支持创建和运行后台编码智能体。它为开发者提供了一套完整的全栈解决方案,让开发者无需依赖本地设备就能运行独立的编码工作流。
Open Agents 采用三层架构:Web 接口层、智能体工作流层以及沙箱化的执行环境。Web 层负责身份认证、会话管理与流式交互。智能体以持久化工作流的形式运行,代码执行则在隔离的虚拟机沙箱内完成,沙箱可提供文件系统访问、Shell 命令执行和开发服务器等能力。
其核心架构设计在于将智能体与沙箱解耦。智能体不会直接在虚拟机内部执行代码,而是通过文件操作、搜索、Shell 命令等工具与沙箱交互。这种设计能够让智能体生命周期与沙箱生命周期独立演进,同时支持工作流脱离单次请求实现持久化运行,沙箱还可根据实际需求进行暂停、休眠与恢复。
该平台支持多步执行、流式输出以及任务取消功能。开发者可克隆仓库、创建分支,并借助 GitHub 集成实现提交与拉取请求的自动化操作。会话能够通过只读链接进行分享,并支持接入 ElevenLabs 转录服务实现语音输入。
从运行时角度看,Open Agents 依赖持久化工作流而非基于请求的执行模式。每次交互都会触发一个工作流,可跨越多个步骤并随时间持续运行。活动会话可通过重新连接工作流流来恢复,而沙箱则利用基于快照的状态机制在闲置后还原环境。
该项目需要若干基础设施组件才能运行,包括用于状态管理和 OAuth 认证的 PostgreSQL 数据库,以及用于访问仓库和自动化创建拉取请求等任务的 GitHub 集成。可选组件如 Redis 或键值存储可用于数据缓存。
Open Agents 的定位是参考实现,而非成品项目。该仓库可供开发者 Fork 并进行二次开发,让开发者能够深入了解智能体工作流、沙箱编排以及各类集成功能的具体实现方式。该项目可在 Vercel 上部署,可手动配置环境变量与各项服务,完整展现底层的系统设计。
智能体逻辑与执行环境的分离引发了各界不同反响。Michiel Voortman 评论道:
你提到虚拟机与智能体的分离是该项目的核心理念。
但我认为这种架构从中长期来看会拖慢智能体的发展。它虽然具备更好的可扩展性,却限制了智能体的自主自由度,进而制约它的能力与“创造力”。我认为正确的思路应该是先为每个智能体分配一台计算资源,再随着模型能力提升和任务交接机制的完善逐步扩容至十台、百台、千台计算资源。
此次发布标志着编码智能体正从单纯的请求绑定工具向长期运行的系统转变。通过将工作流编排与隔离执行环境相结合,Open Agents 使持续运行的智能体成为可能——它们能够与外部系统交互,并自主管理代码变更。
原文链接:
https://www.infoq.com/news/2026/04/vercel-open-agents/