快讯列表

关于 机器推理 的快讯列表

时间 详情
2026-02-12
21:01
Gemini 3 Deep Think 在AI基准测试中创下新纪录

据Demis Hassabis表示,Gemini 3 Deep Think模型进行了重要升级,在关键AI性能基准测试中取得了突破性成果,包括在ARC-AGI-2中获得84.6%的得分,在无工具情况下完成Humanity's Last Exam取得48.4%,以及在Codeforces上达到3455 Elo评分。这些进展突显了该模型在数学、科学和推理领域的强大能力,为AI驱动的创新和应用提供了重要意义。

来源