快讯列表

关于 METR基准 的快讯列表

时间 详情
2026-01-15
22:18
Anthropic披露API数据:Claude在3.5小时任务成功率50%,更长时任务高度可靠,对比METR基准

根据@AnthropicAI称,API数据表明Claude在3.5小时任务上的成功率为50%,且在更长时长任务上“高度可靠”。来源:@AnthropicAI 于X平台,2026年1月15日。 根据@AnthropicAI称,这些任务时长长于METR基准,但性质不同,因为用户可在Claude擅长的任务上通过迭代提升成功率。来源:@AnthropicAI 于X平台,2026年1月15日。 根据@AnthropicAI称,该帖附带链接https://t.co/RxKnLNMEYj与图片,且未提及加密资产、代币、定价、合作或发布时间线。来源:@AnthropicAI 于X平台,2026年1月15日。 根据@AnthropicAI称,帖子未提及加密市场,表明此次更新未提供直接的加密市场关联信息。来源:@AnthropicAI 于X平台,2026年1月15日。

来源