多模态AI模型 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 多模态AI模型

时间 详情
2025-12-19
11:46
波士顿动力公布2026年Atlas路线图,谷歌发布Gemini 3 Flash多模态AI模型

根据@AINewsOfficial_报道,波士顿动力公司公布了2026年Atlas人形机器人路线图,重点推进机器人敏捷性、能效及物流、制造业真实场景应用(来源:https://youtu.be/UAQeSRnuBN0)。与此同时,谷歌推出了Gemini 3 Flash多模态AI模型,可高速处理文本、图像及视频,聚焦企业自动化与创新内容生成(来源:@AINewsOfficial_,2025年12月19日)。这些AI行业新动态为企业在智能机器人与多模态AI应用领域带来巨大商机与创新空间。

2025-12-18
16:58
Meta开源PE-AV模型:突破性多模态音频视觉AI推动音频分离技术新高度

据@AIatMeta消息,Meta正式开源了Perception Encoder Audiovisual(PE-AV)模型,这是驱动SAM Audio音频分离技术的核心AI引擎(来源:@AIatMeta,2025年12月18日)。PE-AV基于今年早些时候发布的Perception Encoder模型,能够融合音频和视觉感知,在多项音视频基准测试中取得了业界领先的成绩。其原生多模态支持不仅提升了声音检测,还丰富了音视频场景理解,广泛应用于音频取证、视频内容分析和无障碍解决方案等实际场景。Meta此次开源代码和论文,推动多模态AI创新,为希望将先进音视频机器学习模型商业化的企业和创业公司提供了全新商机(来源:https://go.meta.me/e541b6,https://go.meta.me/7fbef0)。

2025-10-13
22:15
Andrew Ng推出Agentic AI实战课程,Antrhopic Claude Sonnet 4.5与OpenAI、Meta多元化AI产品线发布

据DeepLearning.AI报道,吴恩达宣布推出全新Agentic AI实战课程,聚焦反思、工具使用、规划和多智能体协作四大设计模式,帮助专业人士掌握AI智能体开发与落地(来源:DeepLearning.AI, The Batch, 2025年10月13日)。Anthropic发布Claude Sonnet 4.5并重大升级Claude Code,增强企业自动化与AI开发能力。OpenAI和Meta加速扩展AI产品线,满足不同行业需求。阿里巴巴发布Qwen3-Max并开放多模态Qwen3-VL/Omni模型,推动AI应用创新。LoRA适配器的普及进一步简化模型微调。这些进展显示Agentic AI、企业自动化和多模态AI应用成为行业新机遇(来源:DeepLearning.AI, The Batch)。