OpenAI 的 GPT-5.5 发布，基准测试得分 91.7%

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

OpenAI 于 2026 年 4 月 23 日正式发布了其最新的 AI 模型 GPT-5.5，在专业和技术应用领域推向人工智能的新高度。早期评估显示，该模型在 Harvey.ai 的 BigLaw Bench 测评套件中取得了令人印象深刻的 91.7% 得分，超越了 GPT-5.4 已经很强的 91.0%。这标志着 OpenAI 的生成模型达到了一个新高峰，并将 GPT-5.5 定位为法律和技术行业的有力工具。

GPT-5.5 专为处理复杂和模糊任务而设计，展示了在编码、数据分析和自主任务执行方面的进步。在由 Harvey.ai 进行的法律特定测试中，该模型在风险评估、交易管理和诉讼分析方面表现出了显著的改进。它在 43% 的任务中获得了满分，87% 的任务得分高于 0.80，表明其在多样化用例中的表现始终如一。法律专业人士称赞 GPT-5.5 能够生成具有优越组织结构、直观格式和扎实引用的输出内容。

“GPT-5.5 在法律推理、组织结构和受众把握方面表现出改进，”Harvey 的应用研究主管 Niko Grupen 表示。“这些是对于法律从业者来说真正具有实际意义的提升。”

然而，冗长仍然是一个小问题，因为某些回答在简单查询上过于详细。尽管如此，该模型的整体性能和多功能性表明其在专业应用的 AI 能力方面取得了飞跃。

OpenAI 已经向其 ChatGPT 和 Codex 平台的付费订阅用户提供了 GPT-5.5。Plus、Pro、Business 和 Enterprise 层级的用户可以立即访问，同时还推出了专为高计算工作负载设计的“GPT-5.5 Pro”版本。此次发布还伴随着更新的 API 定价，以反映新模型的增强功能和性能。

通过 GPT-5.5，OpenAI 旨在保持在与 Anthropic 和 Google 等竞争对手的 AI 领域竞赛中的领先地位。该模型的发布凸显了 OpenAI 的策略，即将其 AI 定位为自主的“数字工作者”，能够以最少的人类干预处理任务。OpenAI 总裁 Greg Brockman 表示，GPT-5.5 能够在没有明确逐步指令的情况下解决问题，这代表了 AI 自主性的重要飞跃。

对于用户和开发者来说，GPT-5.5 不仅带来了渐进式的改进，还提供了一层新的功能，这可能会重新定义各行业的工作流程。随着组织开始将该模型集成到其运营中，其影响可能会在未来几个月内塑造 AI 和法律科技领域的市场动态。

Image source: Shutterstock

Bookmark

OpenAI 的 GPT-5.5 发布，基准测试得分 91.7%

Premium Sponsors

Flash News