快讯列表

关于 AI 基准测试 的快讯列表

时间 详情
2025-09-25
16:24
OpenAI 发布 GDPval v0:面向真实经济任务的证据型 AI 基准,交易者应关注的要点

据 @OpenAI 称,其推出了 GDPval,这是一项用于衡量 AI 在真实、具有经济价值任务上的新评测;来源:@OpenAI 2025年9月25日推文及其链接的官方 GDPval v0 页面。@OpenAI 表示,该评测旨在以证据而非臆测来衡量进展,并用于跟踪 AI 在最重要工作的改进;来源:@OpenAI 2025年9月25日推文。就交易相关性而言,@OpenAI 的发布为经济任务提供了一个官方、基于证据的基准,市场参与者可直接通过 GDPval v0 官方页面获取任务定义与后续更新;来源:@OpenAI 2025年9月25日推文及其链接的官方 GDPval v0 页面。

来源