xAI发布Grok Imagine 1.5预览版图像转视频模型
realtime news Jun 04, 2026 01:32
xAI的Grok Imagine 1.5预览版通过API亮相,带来先进的图像转视频功能,支持720p输出和无缝工作流程。
xAI推出了Grok Imagine Video 1.5预览版,这是其图像转视频AI模型的最新版本,现在可通过API访问。这一版本于2026年6月3日宣布发布,基于Grok Imagine 1.0的基础,新增了增强的视频质量、扩展的工作流程以及为开发者提供的生产级支持。
主要升级包括将单张图像转换为流畅的电影级视频剪辑,分辨率最高可达720p。用户可以通过自然语言提示指导动画,指定摄像机移动、节奏甚至声音设计。该模型保留了输入图像的细节和光照,确保连贯性而非重新解读。开发者还可以将多个剪辑串联起来,创建一致且更长的序列——这一功能对内容创作者和电影制作者尤为有用。
根据最近的第三方评估,Grok Imagine 1.5在视觉质量和用户引导的工作流程方面超越了竞争模型,如Seedance 2.0和HappyHorse 1.0。截至2026年5月30日,该模型在Arena.ai图像转视频排行榜上以+52 Elo分的优势位居榜首。这一改进使Grok Imagine 1.5成为图像转视频AI领域的领先者。
该版本是xAI更广泛的Grok生态系统的一部分,自其成立以来,该生态系统发展迅速。Grok-1于2023年推出,采用了3140亿参数的专家混合模型,而Grok Imagine 1.0则于今年早些时候发布,提供了10秒视频生成功能。1.5版进一步优化了xAI的产品,集成了如“视频扩展”功能以串联动画,以及标准化API以实现开发者的无缝访问等特性。
除了技术能力之外,Grok Imagine 1.5还反映了xAI在商业和政府AI市场上的雄心壮志。值得注意的是,xAI于2026年2月与美国国防部达成协议,将Grok模型应用于机密系统,这显示了该技术的重要战略意义。
对模型感兴趣的开发者可以通过几行代码通过API开始实验,正如预览版公告中所示。该模型能够以最少的输入生成电影级动画,使其成为从媒体制作到虚拟现实等行业的一个引人注目的工具。
目前,Grok Imagine Video 1.5预览版已通过初步API发布提供使用,随着xAI继续改进其平台,预计还会有进一步的更新。对于希望利用尖端AI驱动视频生成的开发者和企业来说,此次发布可能标志着自动化和内容创建领域的重要一步。
Image source: Shutterstock