predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

Claude Fable 5刷新FrontierMath

据@emollick与Epoch AI称，Fable 5在FrontierMath达87%与88%。

详细分析

2026年6月12日Ethan Mollick转发Epoch AI Research推文指出Anthropic Claude Fable 5在FrontierMath基准测试中表现优异Tiers 1-3达到87%Tiers 4达到88%延续了Anthropic模型在数学能力上的快速提升趋势。

该模型在FrontierMath竞赛级与研究级题目上展现出强大多步推理能力反映Anthropic在后训练阶段对逻辑一致性的优化成果。

结果再次验证缩放定律通过增加训练算力即可稳定提升数学得分无需全新基础架构。

金融企业可利用模型实时进行风险建模与衍生品定价科研机构可加速假设生成与证明验证教育科技平台可打造自适应高等数学辅导系统。落地需结合提示工程与人工校验以降低边缘错误。

下一代模型有望将同类基准推高至95%以上推动AI自主开展应用数学研究同时监管机构可能关注密码学与材料科学等双用领域。

FrontierMath Tiers 1-4 v2Tiers 1-3为87%Tier 4为88%数据来自2026年6月Epoch AI Research。

符合经典缩放曲线进步源于算力与数据而非突然架构突破。

量化金融科学研究与高等教育可立即提升生产力。

需人工校验与领域微调以处理新颖问题中的残余错误。

预计未来两代模型将突破95%准确率。

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech