谷歌的Veo 3增强了AI从图像到视频的创建
realtime news Aug 01, 2025 18:43
谷歌推出Veo 3,这是一款尖端的AI工具,能够将图像转化为视频,为创作者提供增强的视觉故事讲述控制。

据Leonardo.ai报道,谷歌推出了Veo 3,这是一款创新的AI驱动工具,旨在将静态图像转换为动态视频。该工具使创作者能够从第一个画面精心打造他们的视觉叙事,提供了前所未有的视觉故事讲述过程的控制。
高级功能和模型
Veo 3 通过提供16种模型和预设选项,使其在众多工具中脱颖而出,确保创作者无需在视频输出的质量或风格上做出妥协。这些选项包括以其逼真和电影感输出而闻名的Lucid Realism,以及提供业内领先的提示依从性和视觉元素一致性的Flux模型。此外,来自Open AI的GPT-Image-1模型允许对提示的出色遵从,利用图像参考来增强视频创建。
另一个值得注意的功能是Phoenix模型,它以其能够紧密跟随参考图像而受到赞誉,并在Leo社区中备受喜爱。经过微调的预设如动漫、库存摄影和概念艺术,为创作者提供了符合他们项目需求的特定美学选择。
自定义和精度
Veo 3 利用LoRA训练,允许用户创建学习特定视觉风格或角色设计的自定义模型。通过仅使用五张图像,创作者可以开发一个LoRA模型,以提高其视频叙事的准确性。这一功能在Leonardo的平台上可用,利用Flux和SDXL模型进行训练。
此外,Veo 3 包含Omni编辑功能,使用户能够对起始帧进行精确调整,而不影响其他元素。这一灵活性允许创建起始帧的多种变化,促进多样化的视觉故事讲述选项。
应用和灵感
Veo 3 的潜在应用是广泛的。创作者可以为重大事件制作炒作片,通过视频将产品原型栩栩如生地呈现,创建带有对话的电影场景,或生成用于前期制作会议的分镜头脚本。该工具将音效、音乐和剧本结合的能力进一步增强了创作过程,允许更全面的方法进行视频创建。
谷歌的Veo 3 AI工具标志着数字内容创建领域的重大进步,为希望提升其视觉故事讲述能力的艺术家、市场营销人员和电影制作人提供了强大的资源。
Image source: Shutterstock