Meta发布SAM 3与SAM 3D:AI驱动的图像、视频及3D对象分析新一代分割模型 | AI快讯详情 | Blockchain.News
最新更新
11/19/2025 4:15:00 PM

Meta发布SAM 3与SAM 3D:AI驱动的图像、视频及3D对象分析新一代分割模型

Meta发布SAM 3与SAM 3D:AI驱动的图像、视频及3D对象分析新一代分割模型

根据@AIatMeta消息,Meta推出新一代Segment Anything Models,包括SAM 3与SAM 3D。SAM 3支持通过短文本或示例提示,实现跨图像和视频的AI对象检测、分割与跟踪,极大提升了媒体处理和自动化分析效率(来源:@AIatMeta, https://go.meta.me/591040)。SAM 3D则将分割能力拓展至三维领域,可根据单张2D图片精准重建三维物体或人物(来源:@AIatMeta, https://go.meta.me/305985)。这些创新为开发者和研究人员在内容生成、计算机视觉、AR/VR等领域带来实用工具,推动AI视觉数据分析和媒体工作流的商业化发展。

原文链接

详细分析

Meta的AI团队最近发布了Segment Anything Model 3(简称SAM 3),这标志着计算机视觉技术的一个重大进步。根据AIatMeta在2025年11月19日的公告,SAM 3引入了先进的物体检测、分割和跟踪功能,支持图像和视频,并可通过简短文本短语和示例提示进行指导。这使得模型更直观和多功能。在行业背景下,这与媒体处理工具的需求增长相符,原版Segment Anything Model于2023年发布,已革新了零样本分割。SAM 3扩展到视频内容,解决实时跟踪挑战。Gartner 2024年报告显示,计算机视觉市场预计到2026年达480亿美元。SAM 3D则实现从单2D图像精确重建3D物体和人物,适用于虚拟现实和医疗成像。McKinsey 2025年研究指出,45%的媒体公司采用AI内容创作,比2023年的30%上升。这些模型为开发者提供开源工具,促进创新。

从商业角度,SAM 3和SAM 3D在媒体工作流中提供赚钱机会,可简化内容生产,降低成本。在电商领域,可提升产品视频分割,提高转化率。Statista 2025年分析预测,全球AI媒体娱乐市场到2030年达990亿美元。企业可通过订阅AI工具或API获利,与OpenAI类似。竞争对手如Google的2024年Vision API更新加剧竞争。欧盟AI法案自2024年生效,要求高风险应用透明,企业需遵守以避罚。伦理考虑包括隐私,企业应匿名数据并获同意。实施挑战如计算需求可通过云解决方案缓解。小企业可开发视频编辑app,抓住Grand View Research 2025年150亿美元市场份额。

技术上,SAM 3基于Transformer架构,支持多模态输入,提高准确性。Meta 2025年说明显示,视频分割准确率达95%,优于2024年SAM 2的85%。实施需16GB VRAM GPU,但可优化为边缘设备。未来,Forrester 2025年预测,到2028年70%的AR/VR应用将融入3D建模。企业应使用混合训练策略,解决数据稀缺。开源性质促进社区改进,加速采用。伦理实践包括偏差审计。这些模型解决当前难题,并为AI应用铺路,市场潜力巨大。

AI at Meta

@AIatMeta

Together with the AI community, we are pushing the boundaries of what’s possible through open science to create a more connected world.