xAI 推出 Grok 4 Fast:成本效率 AI 的飞跃
realtime news Sep 19, 2025 22:26
xAI 推出 Grok 4 Fast,推进具有卓越 token 效率和性能的成本效率推理模型,为企业和消费者应用提供统一架构。

Grok 4 Fast 简介
xAI 推出了 Grok 4 Fast,这是一项在成本效率推理模型领域的突破性进展。基于 Grok 4 的成功,这一新模型提供了卓越的 token 效率,使高质量推理在各个领域对开发者和用户来说更易获得。Grok 4 Fast 将最先进的成本效率与先进的 Web 和 X 搜索功能相结合,拥有一个 2M token 的上下文窗口和用于推理和非推理模式的统一架构。
性能与效率
根据 xAI 的说法,Grok 4 Fast 在推理基准上超越了其前身 Grok 3 Mini,达到了与 Grok 4 相似的性能,同时减少了 40% 的 token 使用量。这一效率导致在前沿基准上实现同等性能的成本降低了 98%。模型的增强智能密度通过 Artificial Analysis 的独立审查得到了验证,证明了其卓越的价格与智能比。
先进功能
Grok 4 Fast 采用大规模强化学习优化其工具使用能力。该模型擅长于决策何时使用诸如代码执行或网页浏览等工具,具有先进的自主搜索能力。它能够无缝浏览互联网,以高速访问实时数据并综合信息,为一般领域内的成本高效智能设定了新的标准。
基准成功
模型在 LMArena 的搜索竞技场中表现出众,Grok 4 Fast 在代号 'menlo' 下以 Elo 评分 1163 获得了第一名,领先其最近竞争对手许多。在文本竞技场中,Grok 4 Fast 排名第八,展现出与更大模型相比的卓越智能密度。
统一架构
Grok 4 Fast 引入了一种统一架构,将推理与非推理能力结合在同一模型权重中,降低了延迟和 token 成本。该架构允许实时应用,适用于简单和复杂查询。使用 xAI API 的开发者可以微调模型行为,以优化速度或深度。
可用性与定价
Grok 4 Fast 现已对所有用户开放,包括免费用户,这是向民主化先进 AI 迈出的重要一步。模型提供两个版本:'grok-4-fast-reasoning' 和 'grok-4-fast-non-reasoning',每个版本支持一个 2M token 上下文窗口。定价根据 token 使用量有所不同,输入 token 的价格为每百万 $0.20(少于 128k tokens),超过 128k tokens 则为每百万 $0.40。输出 token 的价格为每百万 $0.50(少于 128k tokens),使用量更高的价格为每百万 $1.00。
更多信息请访问 xAI 网站上的 Grok 4 Fast 模型卡。xAI 计划根据用户反馈继续增强 Grok 4 Fast,未来将包括多模态能力和自主功能。
欲了解更多详情,请访问 xAI 官方公告。
Image source: Shutterstock