人工智能基准 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 人工智能基准

时间 详情
2025-09-25
16:24
OpenAI发布GDPval评估体系:衡量AI在经济高价值任务中的实际表现

据OpenAI(@OpenAI)官方消息,OpenAI正式推出了GDPval评估体系,用于衡量人工智能在现实经济高价值任务中的表现。该评估框架强调以数据和证据为基础,帮助企业和开发者追踪AI在实际业务工作中的提升和经济贡献。GDPval针对直接推动经济生产力的应用场景,填补了AI行业缺乏反映真实商业价值标准的空白,为企业在AI落地和业务流程优化方面提供了有力的决策依据。(来源:OpenAI,https://openai.com/index/gdpval-v0)

2025-09-02
20:17
斯坦福行为挑战赛2024:AI评估和提交流程,NeurIPS大赛机遇

据StanfordBehavior(推特)消息,斯坦福行为挑战赛已在官方网站(behavior.stanford.edu/challenge)公布了详细的AI模型提交与评估标准。AI从业者和研究人员可即刻参与实验,赶在2024年11月15日截止日前提交作品。获奖者将在12月1日公布,并有机会在12月6日至7日于圣地亚哥举行的NeurIPS国际AI大会现场参与挑战。本次赛事为AI行为建模、方法创新和行业曝光提供了重要机遇(来源:StanfordBehavior推特)。