快讯列表

关于 AI测评 的快讯列表

时间 详情
2026-02-04
22:00
Artificial Analysis发布Intelligence Index 4.0:面向企业的大语言模型评测聚焦经济有用工作与可靠性

据@DeepLearningAI称,Artificial Analysis发布了Intelligence Index 4.0,用新的测试取代已饱和的基准,重点评估经济有用工作、事实可靠性与推理能力(来源:@DeepLearningAI)。据@DeepLearningAI称,此次更新旨在更准确反映大语言模型在商业场景中的表现,为企业应用提供更相关的评估信号(来源:@DeepLearningAI)。

来源