OpenAI Codex 更新新增计算机控制功能,服务300万周活跃开发者
realtime news Apr 16, 2026 18:13
OpenAI 发布重大 Codex 更新,新增后台计算机控制、90多个插件和记忆功能,服务每周使用该编程助手的300多万开发者。
OpenAI 对其 Codex 编程助手进行了重大升级,将该工具的能力从传统的代码生成大幅扩展至直接计算机控制、持久记忆和自动化调度——这些功能使其从简单的自动补全工具转变为全天候的开发伙伴。
此次更新于2026年4月16日推出,服务于每周使用 Codex 的300多万开发者。核心亮点功能:后台计算机控制,允许多个AI代理同时操作您的 Mac,而不会干扰您自己的工作。
具体更新内容
Codex 现在可以查看您的屏幕,使用自己的光标在任何应用程序中点击和输入——不仅限于代码编辑器。对于开发者而言,这意味着代理可以测试前端更改、与没有 API 的应用程序交互,或在无需持续手动干预的情况下迭代设计。
新增的应用内浏览器让开发者可以直接在网页上添加评论来引导代理,这对前端开发和游戏开发尤为有用。OpenAI 计划逐步将浏览器功能扩展到本地应用程序之外。
通过 gpt-image-1.5 实现的图像生成功能现已直接集成到工作流程中,允许 Codex 在编写代码的同时为原型设计、产品概念和游戏素材创建和迭代视觉内容。
90多个新插件将该工具的触角延伸至企业工作流程:用于 JIRA 管理的 Atlassian Rovo、CircleCI、GitLab Issues、Microsoft Suite、Neon by Databricks 等。这些插件与 MCP 服务器结合,让 Codex 能够在不同工具之间收集上下文并采取行动。
持久记忆改变游戏规则
也许最重要的变化是 Codex 的新记忆系统。代理现在可以保留之前会话的上下文——个人偏好、修正内容和来之不易的信息。这意味着您无需反复解释项目规范,可以将更多时间用于实际工作。
Codex 还可以为自己安排未来的工作,自动唤醒以继续跨越数天或数周的长期任务。团队正在使用这些自动化功能来处理待合并的 Pull Request、跟进任务,以及监控 Slack、Gmail 和 Notion 上的对话。
该工具现在会根据您的项目、已连接的插件和记忆主动建议工作。它可以识别需要关注的 Google Docs 评论,从多个来源提取上下文,并呈现优先级排序的行动列表。
可用性和限制
此更新立即向使用 ChatGPT 账号登录的 Codex 桌面用户推出。计算机控制功能目前仅支持 macOS。企业版、教育版以及欧盟/英国用户将在后续推出中获得包括记忆和上下文感知建议在内的个性化功能。
对于加密货币开发者而言,扩展的插件生态系统和计算机控制功能可以简化智能合约测试、文档管理和跨工具协调——尽管真正的考验将是记忆系统能否在不同会话之间可靠地保留区块链特定的上下文。
OpenAI 将此次发布定位为其 AGI 使命的一部分,旨在缩小想象与执行之间的差距。Codex 推出一年以来,使用模式已从代码编写扩展到系统理解、调试、团队协调和长期项目管理。此次更新能否兑现这一扩展的承诺,完全取决于执行效果——以及这300万开发者如何将这些功能真正整合到生产工作流程中。
Image source: Shutterstock