关于 人类最后考试 的快讯列表
| 时间 | 详情 | 
|---|---|
| 2025-03-25 17:06 | 
                                        
                                            Gemini 2.5 Pro实验版在数学和科学基准测试中领先
                                        
                                         根据Google DeepMind的消息,Gemini 2.5 Pro实验版在没有测试时间优化的情况下,在GPQA和AIME 2025等数学和科学基准测试中取得了领先成绩。这表明其性能能力强大。此外,它在“人类最后考试”中获得了18.8%的得分,展示了其先进的推理和知识能力。 | 
| 2025-02-03 01:08 | 
                                        
                                            深度研究在“人类最后考试”中获得26.6%,成绩翻倍
                                        
                                         根据Sam Altman的说法,深度研究在“人类最后考试”中获得了26.6%的成绩,远超之前o3-mini-high的13%高分。这一性能的进步表明AI能力的提升,可能会引发对AI相关股票和加密货币的投资者兴趣。交易者应关注AI领域的发展,以寻找潜在机会。 |