Meta发布SAM 3与SAM 3D：AI驱动的图像、视频及3D对象分析新一代分割模型

根据@AIatMeta消息，Meta推出新一代Segment Anything Models，包括SAM 3与SAM 3D。SAM 3支持通过短文本或示例提示，实现跨图像和视频的AI对象检测、分割与跟踪，极大提升了媒体处理和自动化分析效率（来源：@AIatMeta, https://go.meta.me/591040）。SAM 3D则将分割能力拓展至三维领域，可根据单张2D图片精准重建三维物体或人物（来源：@AIatMeta, https://go.meta.me/305985）。这些创新为开发者和研究人员在内容生成、计算机视觉、AR/VR等领域带来实用工具，推动AI视觉数据分析和媒体工作流的商业化发展。

原文链接

详细分析

Meta的AI团队最近发布了Segment Anything Model 3（简称SAM 3），这标志着计算机视觉技术的一个重大进步。根据AIatMeta在2025年11月19日的公告，SAM 3引入了先进的物体检测、分割和跟踪功能，支持图像和视频，并可通过简短文本短语和示例提示进行指导。这使得模型更直观和多功能。在行业背景下，这与媒体处理工具的需求增长相符，原版Segment Anything Model于2023年发布，已革新了零样本分割。SAM 3扩展到视频内容，解决实时跟踪挑战。Gartner 2024年报告显示，计算机视觉市场预计到2026年达480亿美元。SAM 3D则实现从单2D图像精确重建3D物体和人物，适用于虚拟现实和医疗成像。McKinsey 2025年研究指出，45%的媒体公司采用AI内容创作，比2023年的30%上升。这些模型为开发者提供开源工具，促进创新。

从商业角度，SAM 3和SAM 3D在媒体工作流中提供赚钱机会，可简化内容生产，降低成本。在电商领域，可提升产品视频分割，提高转化率。Statista 2025年分析预测，全球AI媒体娱乐市场到2030年达990亿美元。企业可通过订阅AI工具或API获利，与OpenAI类似。竞争对手如Google的2024年Vision API更新加剧竞争。欧盟AI法案自2024年生效，要求高风险应用透明，企业需遵守以避罚。伦理考虑包括隐私，企业应匿名数据并获同意。实施挑战如计算需求可通过云解决方案缓解。小企业可开发视频编辑app，抓住Grand View Research 2025年150亿美元市场份额。

技术上，SAM 3基于Transformer架构，支持多模态输入，提高准确性。Meta 2025年说明显示，视频分割准确率达95%，优于2024年SAM 2的85%。实施需16GB VRAM GPU，但可优化为边缘设备。未来，Forrester 2025年预测，到2028年70%的AR/VR应用将融入3D建模。企业应使用混合训练策略，解决数据稀缺。开源性质促进社区改进，加速采用。伦理实践包括偏差审计。这些模型解决当前难题，并为AI应用铺路，市场潜力巨大。

AI图像分割 SAM 3 SAM 3D 三维重建分割模型媒体自动化计算机视觉

AI at Meta

@AIatMeta

Together with the AI community, we are pushing the boundaries of what’s possible through open science to create a more connected world.

Meta发布SAM 3与SAM 3D：AI驱动的图像、视频及3D对象分析新一代分割模型

详细分析

AI at Meta

Premium 赞助商

热门话题