OpenAI 的 GPT-5.5 发布,基准测试得分 91.7%
realtime news Apr 23, 2026 18:58
OpenAI 的 GPT-5.5 全新登场,具备增强的法律 AI 功能,在基准测试中取得 91.7% 的高分。现已向 ChatGPT Plus 和 Pro 用户开放。
OpenAI 于 2026 年 4 月 23 日正式发布了其最新的 AI 模型 GPT-5.5,在专业和技术应用领域推向人工智能的新高度。早期评估显示,该模型在 Harvey.ai 的 BigLaw Bench 测评套件中取得了令人印象深刻的 91.7% 得分,超越了 GPT-5.4 已经很强的 91.0%。这标志着 OpenAI 的生成模型达到了一个新高峰,并将 GPT-5.5 定位为法律和技术行业的有力工具。
GPT-5.5 专为处理复杂和模糊任务而设计,展示了在编码、数据分析和自主任务执行方面的进步。在由 Harvey.ai 进行的法律特定测试中,该模型在风险评估、交易管理和诉讼分析方面表现出了显著的改进。它在 43% 的任务中获得了满分,87% 的任务得分高于 0.80,表明其在多样化用例中的表现始终如一。法律专业人士称赞 GPT-5.5 能够生成具有优越组织结构、直观格式和扎实引用的输出内容。
“GPT-5.5 在法律推理、组织结构和受众把握方面表现出改进,”Harvey 的应用研究主管 Niko Grupen 表示。“这些是对于法律从业者来说真正具有实际意义的提升。”
然而,冗长仍然是一个小问题,因为某些回答在简单查询上过于详细。尽管如此,该模型的整体性能和多功能性表明其在专业应用的 AI 能力方面取得了飞跃。
OpenAI 已经向其 ChatGPT 和 Codex 平台的付费订阅用户提供了 GPT-5.5。Plus、Pro、Business 和 Enterprise 层级的用户可以立即访问,同时还推出了专为高计算工作负载设计的“GPT-5.5 Pro”版本。此次发布还伴随着更新的 API 定价,以反映新模型的增强功能和性能。
通过 GPT-5.5,OpenAI 旨在保持在与 Anthropic 和 Google 等竞争对手的 AI 领域竞赛中的领先地位。该模型的发布凸显了 OpenAI 的策略,即将其 AI 定位为自主的“数字工作者”,能够以最少的人类干预处理任务。OpenAI 总裁 Greg Brockman 表示,GPT-5.5 能够在没有明确逐步指令的情况下解决问题,这代表了 AI 自主性的重要飞跃。
对于用户和开发者来说,GPT-5.5 不仅带来了渐进式的改进,还提供了一层新的功能,这可能会重新定义各行业的工作流程。随着组织开始将该模型集成到其运营中,其影响可能会在未来几个月内塑造 AI 和法律科技领域的市场动态。
Image source: Shutterstock