AI 快讯列表关于 多模态
| 时间 | 详情 |
|---|---|
|
2026-06-25 11:05 |
PicLumen无限画布统一创作流程
据@PicLumen称,无限画布将把提示词、图片、视频与资产整合到单一工作区。 |
|
2026-06-18 21:52 |
M*运行时统一多模态推理提速12.5×
据StanfordAI Lab称,M*在TTS与世界模型回滚上最高快2.7×与12.5×。 |
|
2026-06-15 16:49 |
多模态模型在视觉环节失误分析
据emollick称,视觉环节最易出错,源于模型视觉性能不足。 |
|
2026-06-12 17:00 |
谷歌Gemini发布Neural Expressive亮点
据@GeminiApp称,周五Discord直播展示动态视觉与无缝模式切换。 |
|
2026-06-04 02:00 |
Gemma 4 12B在笔电直跑,Apache许可
据JeffDean称,Gemma 4 12B为多模态开源权重模型,可在笔电本地运行。 |
|
2026-06-03 22:18 |
斯坦福AI实验室发布视频基准解析
据StanfordAILab介绍,团队发布视频理解基准与演示,涵盖指标与结论。 |
|
2026-06-03 21:05 |
OpenAI Codex预告引发飞行演示热议
据@gdb与OpenAI视频预告,Codex展示飞行相关演示,细节待公布。 |
|
2026-06-03 18:35 |
Gemma 4 12B发布 采用Apache
据@demishassabis,Gemma 4累计超1.5亿次下载,新12B本地可在16GB显存运行并采用Apache 2.0。 |
|
2026-06-02 16:07 |
Gemini Omni演示展示多模态视频创作
据Google Gemini推特称,6月3日11:30直播演示多模态输入与对话式编辑。 |
|
2026-05-31 07:15 |
Gemini Omni Flash凭平台优势突围
据God of Prompt称,Omni性能不及Seedance,但凭谷歌生态集成更易落地。 |
|
2026-05-31 05:22 |
GPT Realtime 2解锁免手操作系统
据@gdb称,GPT Realtime 2实现低延迟语音控机与多模态操作演示。 |
|
2026-05-29 16:56 |
GPIC基准发布 1亿对突破
据李飞飞称,GPIC含1亿训练对、100万评测对,商研可用。 |
|
2026-05-22 17:22 |
Gemini Omni重塑多模态视频编辑
据Ethan Mollick称,Gemini Omni原生多模态编辑,可快速改造1896火车影片。 |
|
2026-05-22 11:50 |
SenseNova U1统一多模态推理
据@godofprompt称,U1将视觉语言与推理整合为单一模型,去除适配器与切换。 |
|
2026-05-20 20:07 |
Gemini 3.5 Flash高速发布
据GoogleDeepMind称,Gemini 3.5 Flash上线,推理更快、部署更轻量。 |
|
2026-05-20 17:08 |
Google Cloud新课打造媒体生成智能体
据AndrewYNg称,新课教授相似度、LLM评审与量化量表评估法。 |
|
2026-05-20 12:37 |
谷歌Gemini发布代理与计费新规
据@godofprompt称,I O 2026 发布新模型、个人代理、算力计费与后台监测。 |
|
2026-05-20 01:05 |
Gemini 3.5 Flash极速多模态发布
据@demishassabis称,谷歌博客详解Gemini 3.5 Flash的多模态与开发特性。 |
|
2026-05-20 00:25 |
Gemini Omni驱动故事创作突破
据GoogleDeepMind称,Gemini Omni支持多模态故事快速原型与发布。 |
|
2026-05-19 23:53 |
ByteDance Lance击败7B模型
据KyeGomezB称,3B参数Lance统一多模态并超越7B模型。 |