Google 的 Gemini 应用在 I/O 2026 中新增 AI 代理和主动工具
realtime news May 19, 2026 20:05
Google 通过主动 AI 代理、媒体生成和无缝任务自动化重新定义其 Gemini 应用,标志着 AI 策略的重大转变。
Google 在 I/O 2026 上对其 Gemini 应用进行了全面改革,将其从一个被动的聊天机器人转变为一个主动的AI平台,新增了 Gemini Spark、Daily Brief 和 Gemini Omni 等功能。这一演变使 Google 成为 ChatGPT 和 Anthropic 的 Claude 在追求更具代理性、以任务为导向的 AI 系统竞赛中的直接竞争对手。
最重要的公告是 Gemini Spark,这是一个 24/7 的 AI 代理,旨在自动管理 Google 生态系统中的任务,包括 Gmail、Docs 和 Sheets。用户现在可以自动化重复的工作流程,例如解析信用卡账单中的隐藏费用或将会议笔记合成为精美的文档。Spark 能够持续运行,这意味着即使设备处于空闲状态,它也会在后台继续工作。本周将向受信任的测试用户提供访问权限,并计划下周向 Google AI Ultra 订阅用户在美国进行 beta 测试。
另一个关键功能 Daily Brief 提供个性化的早晨摘要,通过收集来自 Gmail、日历和其他应用程序的更新。与传统助手不同,Daily Brief 根据用户特定目标优先排序任务并建议可操作的下一步措施,从被动的信息检索转变为主动的任务管理。从今天开始,这一功能将面向美国的 Google AI Plus、Pro 和 Ultra 订阅用户提供。
另一项重大更新 Gemini Omni 利用多模态 AI 从文本、图像和视频输入创建高质量的电影级视频。用户可以通过简单的提示编辑内容、应用模板,甚至创建 AI 化身。Omni 承诺降低视频制作的门槛,使其无需专业设备或技能即可实现。从今天开始,这项功能将面向高级订阅用户推出。
为了配合这些功能升级,Google 推出了名为 Neural Expressive 的全新界面设计,具有流畅的动画、鲜艳的色彩和动态响应格式,例如叙述视频和交互式时间轴。此设计正在全球范围内推广到网页、Android 和 iOS 平台。
行业背景与竞争影响
Google 的更新标志着其向主动、代理驱动型 AI 的明确转变,与更广泛的行业趋势保持一致。像 OpenAI 和 Anthropic 这样的竞争对手也在增强其大型语言模型的能力,以处理复杂的工作流并集成到生产力工具中。然而,Google 的独特优势在于其与 Workspace 产品、Android 设备以及 Canva 和 Instacart 等第三方应用程序的深度集成,据报道 Spark 可以自主访问这些应用程序以完成任务。
在竞争对手通过面向消费者的工具取得进展后,Google 正通过这一积极举措寻求重新夺回 AI 领导地位。通过将代理型 AI 嵌入其生态系统,Google 不仅强化了 Gemini 作为独立产品的地位,也加强了其更广泛的策略,即将 AI 融入其平台的每个角落,从移动操作系统到生产力和浏览器环境。
2026 年早些时候,Google 在 Android 上引入了多步任务自动化,为今天的公告奠定了基础。随着 Gemini 的功能现在扩展到主动媒体创建和持续任务管理,该应用可能成为 Google AI 生态系统的基石。
接下来是什么?
Google 计划在夏季推出 Gemini Spark 的高级功能,包括自定义子代理、浏览器自动化和语音驱动任务。该应用的 macOS 版本也将集成 Spark,从而实现本地文件自动化和桌面工作流。对于用户而言,这些增强功能预示着一个 AI 助手不仅响应查询,还能主动预测和满足需求的未来。
通过这些更新,Google 正在将 Gemini 定位为一个可以无缝融合个人生产力和创意表达的通用助手。随着 AI 主导权竞争的加剧,这些功能的成功将取决于用户的采用程度以及 Google 在实现其主动、代理型协助承诺方面的表现。
Image source: Shutterstock