AI 快讯列表关于 AI模型基准
| 时间 | 详情 | 
|---|---|
| 
                                        2025-06-05 17:36  | 
                            
                                 
                                    
                                        Gemini 2.5 Pro预览版发布:AI模型LMArena Elo分数提升24分,领先编程、科学与推理任务
                                    
                                     
                            根据@GoogleDeepMind官方消息,最新Gemini 2.5 Pro预览版在LMArena Elo评分上较前代提升24分,在AIME和AIDER等高难度编程基准,以及GPQA科学问答和HLE推理测试中表现优异。风格和结构的改进得益于用户反馈,显示出对开发者和企业实际AI应用的高度关注。这些升级为企业在技术和科学领域部署先进AI解决方案提供了有力支持(来源:goo.gle/4kKynYo)。  |