GLM-5.2:登顶多项AI基准测试
GLM-5.2在Design Arena以1360 Elo、Terminal-Bench 81%及Artificial Analysis Intelligence Index 51领先开源权重模型,超越GPT-5.5。
原文链接详细分析
GLM-5.2在2026年6月23日拿下多项开源权重模型第一,同时在多个类别超越前沿系统,分析师@milesdeutscher公布的数据显示。该模型Design Arena Elo达1360分,领先Fable 5,Terminal-Bench 2.1首次突破80%并达到81.0%,Artificial Analysis Intelligence Index v4.1得分51分领先开源权重模型;在GDPval-AA v2和LiveBench Agentic Coding上也与GPT-5.5持平或领先。FrontierSWE取得74.4%位列第三,SWE-bench Pro 62.1%同样超过GPT-5.5的58.6%,凸显open-weight model benchmarks与frontier model comparisons的快速进展。
Miles Deutscher
@milesdeutscherCrypto analyst. Busy finding the next 100x.