视觉AI AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 视觉AI

时间 详情
2025-12-07
13:57
Gemini 3 Pro多模态能力革新:引领视觉AI文档、图像与视频智能处理新潮流

据@demishassabis推特消息,Gemini 3 Pro凭借其卓越的多模态能力,成为视觉AI领域的最新SOTA模型,在主流视觉及多模态基准测试中均表现出色(来源:Demis Hassabis推特)。其强大的文档、屏幕、图像、视频及空间理解功能,为企业在智能文档处理、视频分析及多模态数据融合等场景带来广泛商业机会,推动企业自动化与效率提升(来源:Demis Hassabis推特)。

2025-12-01
16:43
Gemini 3 AI模型发布:先进推理、视觉增强与个性化交互推动AI行业升级

根据@GeminiApp消息,最新发布的Gemini 3 AI模型具备先进推理能力、更丰富的视觉输出和更深层次的交互性,为用户带来更直观、更强大、更个性化的体验。用户可通过gemini.google或在应用中选择“Thinking”模式体验该模型。此次发布彰显多模态AI能力升级,为企业在智能客服自动化、创意内容生成和互动数字体验等领域带来实际商业机会(来源:@GeminiApp,2025年12月1日)。

2025-10-16
13:08
微软Copilot通过自然语言和视觉AI功能革新Windows PC交互方式

根据Satya Nadella在Twitter上的消息,微软正在通过Copilot AI助手彻底改变用户与Windows PC的交互方式。Copilot支持自然语言交流、视觉理解以及自动执行任务,用户可以像与人对话一样与电脑交流,Copilot还能识别屏幕内容并主动操作。这一创新代表了多模态AI界面的重大进步,为企业自动化、无障碍解决方案和个人效率工具等行业带来了新的商业机遇(来源:@satyanadella,Twitter,2025年10月16日)。

2025-06-11
17:00
Meta发布V-JEPA-v2:新一代自监督视觉AI模型助力商业应用

据Yann LeCun(@ylecun)消息,Meta正式发布了自监督视觉模型V-JEPA-v2(来源:@ylecun,2025年6月11日)。V-JEPA-v2采用联合嵌入预测架构,能够在无需标注数据的情况下实现高效视觉推理和泛化,大幅降低企业数据标注成本。这一创新将推动自动驾驶、零售分析和医疗影像等行业的AI商业化落地,加速视觉AI系统的普及与应用。