多模态AI模型 AI快讯列表 | Blockchain.News

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

AI 快讯列表

AI 快讯列表关于多模态AI模型

时间	详情
2025-12-20 14:59	亚马逊Nova 2系列发布：多模态AI模型和Nova Forge定制训练推动企业创新根据DeepLearning.AI报道，亚马逊推出Nova 2系列（Pro、Omni、Lite和Sonic），在多模态推理和生成方面具有强大竞争力。Nova Forge允许企业将自有数据与亚马逊模型结合，进行定制化AI训练，满足不同行业需求。同时，Nova Act引入先进的浏览器自动化智能体，可实现网页导航、表单填写与数据提取，提高业务流程自动化水平。早期基准测试显示，Nova 2 Pro在多项评估中与业界领先模型表现相当，为企业利用亚马逊AI基础设施实现定制解决方案和流程自动化带来新机遇（来源：DeepLearning.AI, The Batch）。原文链接
2025-12-19 11:46	波士顿动力公布2026年Atlas路线图，谷歌发布Gemini 3 Flash多模态AI模型根据@AINewsOfficial_报道，波士顿动力公司公布了2026年Atlas人形机器人路线图，重点推进机器人敏捷性、能效及物流、制造业真实场景应用（来源：https://youtu.be/UAQeSRnuBN0）。与此同时，谷歌推出了Gemini 3 Flash多模态AI模型，可高速处理文本、图像及视频，聚焦企业自动化与创新内容生成（来源：@AINewsOfficial_，2025年12月19日）。这些AI行业新动态为企业在智能机器人与多模态AI应用领域带来巨大商机与创新空间。原文链接
2025-12-18 16:58	Meta开源PE-AV模型：突破性多模态音频视觉AI推动音频分离技术新高度据@AIatMeta消息，Meta正式开源了Perception Encoder Audiovisual（PE-AV）模型，这是驱动SAM Audio音频分离技术的核心AI引擎（来源：@AIatMeta，2025年12月18日）。PE-AV基于今年早些时候发布的Perception Encoder模型，能够融合音频和视觉感知，在多项音视频基准测试中取得了业界领先的成绩。其原生多模态支持不仅提升了声音检测，还丰富了音视频场景理解，广泛应用于音频取证、视频内容分析和无障碍解决方案等实际场景。Meta此次开源代码和论文，推动多模态AI创新，为希望将先进音视频机器学习模型商业化的企业和创业公司提供了全新商机（来源：https://go.meta.me/e541b6，https://go.meta.me/7fbef0）。原文链接
2025-10-13 22:15	Andrew Ng推出Agentic AI实战课程，Antrhopic Claude Sonnet 4.5与OpenAI、Meta多元化AI产品线发布据DeepLearning.AI报道，吴恩达宣布推出全新Agentic AI实战课程，聚焦反思、工具使用、规划和多智能体协作四大设计模式，帮助专业人士掌握AI智能体开发与落地（来源：DeepLearning.AI, The Batch, 2025年10月13日）。Anthropic发布Claude Sonnet 4.5并重大升级Claude Code，增强企业自动化与AI开发能力。OpenAI和Meta加速扩展AI产品线，满足不同行业需求。阿里巴巴发布Qwen3-Max并开放多模态Qwen3-VL/Omni模型，推动AI应用创新。LoRA适配器的普及进一步简化模型微调。这些进展显示Agentic AI、企业自动化和多模态AI应用成为行业新机遇（来源：DeepLearning.AI, The Batch）。原文链接