HLE AI快讯列表

AI 快讯列表

AI 快讯列表关于 HLE

时间	详情
2026-04-21 16:30	Google 发布 Gemini API Deep Research 升级：支持 MCP、原生图表生成与 Max 模式质量飞跃根据 Sundar Pichai 在 X 的信息，Google 为 Gemini API 的 Deep Research 上线两项升级：更高质量并支持 MCP，以及原生图表与信息图生成；同时提供 Max 模式，采用扩展测试时计算，在 DeepSearchQA 达到 93.3%，在 HLE 达到 54.6%（来源：Sundar Pichai）。据 Sundar Pichai 报道，企业可用标准 Deep Research 获得快速综合，用 Max 获得更深的检索与更强的推理质量，用于竞品分析、技术尽调与 KPI 报告等场景，并自动生成可视化。根据 Sundar Pichai，MCP 集成带来结构化工具与数据接入，便于构建分析助理与研究代理的多模态与程序化工作流。原文链接
2026-02-12 21:01	Gemini 3 Deep Think 创下新基准纪录：ARC‑AGI‑2 84.6%、HLE 48.4%、Codeforces 3455 Elo 权威解析据 Demis Hassabis 在 X（推特）发布的信息，Google DeepMind 的 Gemini 3 Deep Think 在 ARC‑AGI‑2 上取得 84.6%，在 Humanity’s Last Exam 无工具条件下达到 48.4%，并在 Codeforces 获得 3455 Elo，均为最新纪录。根据该公告，这些成绩表明其泛化与程序竞赛能力显著提升，可在企业场景中用于更可靠的科学分析、代码生成与自动化测试。依照该来源，ARC‑AGI‑2 领先与高 Elo 水平意味着更强的多步推理与错误恢复能力，为研发提效、软件交付加速与生产推理重试率降低带来可量化机会。原文链接

时间

详情

2026-04-21
16:30

Google 发布 Gemini API Deep Research 升级：支持 MCP、原生图表生成与 Max 模式质量飞跃

根据 Sundar Pichai 在 X 的信息，Google 为 Gemini API 的 Deep Research 上线两项升级：更高质量并支持 MCP，以及原生图表与信息图生成；同时提供 Max 模式，采用扩展测试时计算，在 DeepSearchQA 达到 93.3%，在 HLE 达到 54.6%（来源：Sundar Pichai）。据 Sundar Pichai 报道，企业可用标准 Deep Research 获得快速综合，用 Max 获得更深的检索与更强的推理质量，用于竞品分析、技术尽调与 KPI 报告等场景，并自动生成可视化。根据 Sundar Pichai，MCP 集成带来结构化工具与数据接入，便于构建分析助理与研究代理的多模态与程序化工作流。

原文链接

2026-02-12
21:01

Gemini 3 Deep Think 创下新基准纪录：ARC‑AGI‑2 84.6%、HLE 48.4%、Codeforces 3455 Elo 权威解析

据 Demis Hassabis 在 X（推特）发布的信息，Google DeepMind 的 Gemini 3 Deep Think 在 ARC‑AGI‑2 上取得 84.6%，在 Humanity’s Last Exam 无工具条件下达到 48.4%，并在 Codeforces 获得 3455 Elo，均为最新纪录。根据该公告，这些成绩表明其泛化与程序竞赛能力显著提升，可在企业场景中用于更可靠的科学分析、代码生成与自动化测试。依照该来源，ARC‑AGI‑2 领先与高 Elo 水平意味着更强的多步推理与错误恢复能力，为研发提效、软件交付加速与生产推理重试率降低带来可量化机会。

原文链接