AI 快讯列表关于 人工智能基准
| 时间 | 详情 | 
|---|---|
| 
                                        2025-09-25 16:24  | 
                            
                                 
                                    
                                        OpenAI发布GDPval评估体系:衡量AI在经济高价值任务中的实际表现
                                    
                                     
                            据OpenAI(@OpenAI)官方消息,OpenAI正式推出了GDPval评估体系,用于衡量人工智能在现实经济高价值任务中的表现。该评估框架强调以数据和证据为基础,帮助企业和开发者追踪AI在实际业务工作中的提升和经济贡献。GDPval针对直接推动经济生产力的应用场景,填补了AI行业缺乏反映真实商业价值标准的空白,为企业在AI落地和业务流程优化方面提供了有力的决策依据。(来源:OpenAI,https://openai.com/index/gdpval-v0)  | 
                        
| 
                                        2025-09-02 20:17  | 
                            
                                 
                                    
                                        斯坦福行为挑战赛2024:AI评估和提交流程,NeurIPS大赛机遇
                                    
                                     
                            据StanfordBehavior(推特)消息,斯坦福行为挑战赛已在官方网站(behavior.stanford.edu/challenge)公布了详细的AI模型提交与评估标准。AI从业者和研究人员可即刻参与实验,赶在2024年11月15日截止日前提交作品。获奖者将在12月1日公布,并有机会在12月6日至7日于圣地亚哥举行的NeurIPS国际AI大会现场参与挑战。本次赛事为AI行为建模、方法创新和行业曝光提供了重要机遇(来源:StanfordBehavior推特)。  |