OpenAI Agents SDK 增加沙箱执行和模型原生执行框架

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

OpenAI 对其 Agents SDK 进行了重大升级，增加了原生沙箱执行功能和模型原生执行框架，让开发者可以构建具备跨文件工作、运行命令以及在受控环境中处理多步任务能力的 AI 代理。

2026 年 4 月 15 日的发布解决了从原型到生产的团队一直面临的一个关键问题：如何弥补拥有强大模型和实际支持代理工作所需的基础设施之间的差距。

新增功能详解

更新后的 SDK 引入了两项核心功能。首先是一个具有可配置内存、支持沙箱的编排工具和类似于 Codex 的文件系统工具的模型原生执行框架。其次是原生沙箱执行功能，为代理提供了一个适当的工作空间——它们可以读取和写入文件、安装依赖项、运行代码，并使用工具，而无需开发者拼凑自己的执行层。

对于沙箱提供者，OpenAI 并没有强迫开发者选择单一选项。内置支持包括 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel。开发者也可以选择自定义沙箱。

SDK 还引入了一个用于描述代理工作空间的 Manifest 抽象。开发者可以挂载本地文件、定义输出目录，并从 AWS S3、Google Cloud Storage、Azure Blob Storage 或 Cloudflare R2 拉取数据。这提高了可移植性——相同的工作空间定义可以从本地开发一直应用到生产部署。

架构重要性解析

OpenAI 在设计 SDK 时明确考虑到了可能发生的提示注入和数据泄漏尝试。通过将执行框架与计算分离，凭据不会暴露在模型生成代码执行的环境中。

这种分离还支持通过快照和恢复实现持久性执行。如果沙箱容器失败或过期，SDK 可以在新容器中恢复代理状态并从最后的检查点继续运行。对于长时间运行的任务，这意味着从灾难性故障变成轻微的中断。

这种架构也带来了可扩展性：代理运行可以启动多个沙箱，仅在需要时调用，使用隔离环境运行子代理，并跨多个容器并行化任务。

早期生产结果

Oscar Health 在临床记录工作流中测试了 SDK。根据 Rachael Burns（高级工程师兼 AI 技术负责人）的说法，这次更新使得“自动化一个关键的临床记录工作流在生产中可行，而之前的方法无法可靠处理。”具体的改进是：能够正确理解复杂医疗记录中的就诊边界，而不仅仅是提取元数据。

当前限制

新的执行框架和沙箱功能目前仅适用于 Python。TypeScript 支持正在开发中，但尚未确定日期。代码模式和子代理功能也计划在未来的版本中为这两种语言提供支持。

定价遵循基于令牌和工具使用的标准 API 费率——未提到单独的沙箱费用。

OpenAI 表示正在努力扩展沙箱提供商的集成，并让 SDK 能够对接更多现有的开发者工具链。对于已经使用与模型无关框架构建代理系统的团队，这一更新的吸引力很明确：更紧密地与前沿模型的最佳表现方式对齐，同时保持代理运行位置或访问敏感数据方式的灵活性。

Image source: Shutterstock

Bookmark

OpenAI Agents SDK 增加沙箱执行和模型原生执行框架

新增功能详解

架构重要性解析

早期生产结果

当前限制

Premium Sponsors

Flash News