AI 快讯列表关于 多模态
| 时间 | 详情 |
|---|---|
|
2026-06-04 02:00 |
Gemma 4 12B在笔电直跑,Apache许可
据JeffDean称,Gemma 4 12B为多模态开源权重模型,可在笔电本地运行。 |
|
2026-06-03 22:18 |
斯坦福AI实验室发布视频基准解析
据StanfordAILab介绍,团队发布视频理解基准与演示,涵盖指标与结论。 |
|
2026-06-03 21:05 |
OpenAI Codex预告引发飞行演示热议
据@gdb与OpenAI视频预告,Codex展示飞行相关演示,细节待公布。 |
|
2026-06-03 18:35 |
Gemma 4 12B发布 采用Apache
据@demishassabis,Gemma 4累计超1.5亿次下载,新12B本地可在16GB显存运行并采用Apache 2.0。 |
|
2026-06-02 16:07 |
Gemini Omni演示展示多模态视频创作
据Google Gemini推特称,6月3日11:30直播演示多模态输入与对话式编辑。 |
|
2026-05-31 07:15 |
Gemini Omni Flash凭平台优势突围
据God of Prompt称,Omni性能不及Seedance,但凭谷歌生态集成更易落地。 |
|
2026-05-31 05:22 |
GPT Realtime 2解锁免手操作系统
据@gdb称,GPT Realtime 2实现低延迟语音控机与多模态操作演示。 |
|
2026-05-29 16:56 |
GPIC基准发布 1亿对突破
据李飞飞称,GPIC含1亿训练对、100万评测对,商研可用。 |
|
2026-05-22 17:22 |
Gemini Omni重塑多模态视频编辑
据Ethan Mollick称,Gemini Omni原生多模态编辑,可快速改造1896火车影片。 |
|
2026-05-22 11:50 |
SenseNova U1统一多模态推理
据@godofprompt称,U1将视觉语言与推理整合为单一模型,去除适配器与切换。 |
|
2026-05-20 20:07 |
Gemini 3.5 Flash高速发布
据GoogleDeepMind称,Gemini 3.5 Flash上线,推理更快、部署更轻量。 |
|
2026-05-20 17:08 |
Google Cloud新课打造媒体生成智能体
据AndrewYNg称,新课教授相似度、LLM评审与量化量表评估法。 |
|
2026-05-20 12:37 |
谷歌Gemini发布代理与计费新规
据@godofprompt称,I O 2026 发布新模型、个人代理、算力计费与后台监测。 |
|
2026-05-20 01:05 |
Gemini 3.5 Flash极速多模态发布
据@demishassabis称,谷歌博客详解Gemini 3.5 Flash的多模态与开发特性。 |
|
2026-05-20 00:25 |
Gemini Omni驱动故事创作突破
据GoogleDeepMind称,Gemini Omni支持多模态故事快速原型与发布。 |
|
2026-05-19 23:53 |
ByteDance Lance击败7B模型
据KyeGomezB称,3B参数Lance统一多模态并超越7B模型。 |
|
2026-05-19 21:36 |
多模态模型测健身器识别力
据DeepLearning.AI称,新投票测试模型识别两种健身器材能力。 |
|
2026-05-19 21:27 |
ChatGPT图像2.0每周驱动15亿创作
据OpenAI称,周产15亿图像,带动设计、原型与营销新工作流。 |
|
2026-05-19 20:16 |
Gemini Omni 推出多模态编辑力
据DemisHassabis称,Gemini Omni可用图像视频音频生成新场景,将率先支持视频输出并扩展到全模态。 |
|
2026-05-19 18:33 |
Gemini 3.5 Flash 评测惊艳
据sundarpichai称,该模型评测亮眼,适合高效多模态应用。 |