AI 快讯列表关于 推理代理
| 时间 | 详情 |
|---|---|
|
2025-12-11 17:13 |
Google DeepMind发布DeepSearchQA:AI复杂网页搜索基准引领行业新高
据Google DeepMind官方推特(@GoogleDeepMind)消息,Google DeepMind正式开源了DeepSearchQA,这是一个用于评估AI代理在复杂网页搜索任务中表现的新基准。其最新AI代理Deep Research在DeepSearchQA基准上取得了业界领先的表现,并在涵盖推理与知识能力的Humanity's Last Exam全套测试中刷新了成绩,同时在难以检索信息的BrowseComp基准上获得了历史最高分。这一进展显示,AI在复杂信息检索与智能知识管理领域正取得突破,为企业级AI搜索和知识解决方案带来全新商业机遇(来源:Google DeepMind推特,2025年12月11日)。 |