关于 AI测评 的快讯列表
| 时间 | 详情 |
|---|---|
|
2026-02-04 22:00 |
Artificial Analysis发布Intelligence Index 4.0:面向企业的大语言模型评测聚焦经济有用工作与可靠性
据@DeepLearningAI称,Artificial Analysis发布了Intelligence Index 4.0,用新的测试取代已饱和的基准,重点评估经济有用工作、事实可靠性与推理能力(来源:@DeepLearningAI)。据@DeepLearningAI称,此次更新旨在更准确反映大语言模型在商业场景中的表现,为企业应用提供更相关的评估信号(来源:@DeepLearningAI)。 |