predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info
思考令牌显著提升LLM表现 | AI快讯详情 | Blockchain.News
最新更新
5/15/2026 12:13:00 AM

思考令牌显著提升LLM表现

思考令牌显著提升LLM表现

据emollick称,UK AISI数据表明思考令牌越多,LLM能力持续提升无平台期。

原文链接

详细分析

在人工智能快速发展的领域,最近的行业洞见强调了缩放定律在提升大型语言模型(LLM)性能方面的持久力量。2026年5月15日,知名AI研究者和教授Ethan Mollick在推文中强调了“第二缩放定律”,该定律表明,通过添加更多“思考令牌”——本质上是扩展模型的推理过程——可以显著提升在复杂任务中的能力,如数学、科学、填字游戏,甚至模拟黑客场景。这一观察源于英国AI安全研究所(AISI)的更新,如Mollick的帖子和Natália Coelho的详细说明所示,表明尚未观察到性能增益的平台期。

关键要点

  • 第二缩放定律关注推理时缩放,通过增加思考令牌提升多样领域表现,根据英国AI安全研究所的更新。
  • 尚未检测到性能平台期,表明无需仅依赖更大训练数据集或更多预训练计算即可持续改进LLM。
  • 这一趋势为商业中的实际AI应用打开大门,从研发中的问题解决到竞争行业的优化决策。

深入探讨第二缩放定律

AI中的缩放定律最早由2020年OpenAI的研究推广,描述了模型性能如何随着数据、参数和计算的增加而可预测地改进。“第二缩放定律”如最近分析所述,将焦点转向测试时或推理时缩放。这涉及提示模型生成中间推理步骤——称为“思考令牌”——模仿人类般的思维链过程。根据Ethan Mollick的2026年推文,这种方法在需要逻辑演绎和创造性问题解决的任务中显示出显著效能。

研究突破和证据

关键更新来自英国AI安全研究所的报告,Mollick引用,该报告显示像“Mythos Preview”这样的模型在分配更多令牌用于审议时达到更高基准。Natália Coelho在X(前Twitter)上的分析以成本为x轴可视化了这一点,显示线性改进而无递减回报。这与Google DeepMind 2023年关于思维链提示的论文一致,该论文在像PaLM这样的模型中将算术推理提高了高达50%。

实施涉及如自我一致性技术,其中模型生成多个推理路径并投票最佳答案,或思想树探索分支可能性。挑战包括更高的计算成本和延迟,但像Hugging Face的Transformers库中的高效令牌管理等解决方案缓解了这些问题。

商业影响和机会

对于企业而言,这一缩放定律转化为AI驱动创新的实际机会。在金融和医疗保健等领域,增强思考令牌的LLM可以更准确地执行高级风险评估或诊断模拟。市场趋势表明对此类能力的需求日益增长;2024年Gartner报告预测,到2027年,70%的企业将采用推理时优化AI工具。

货币化策略包括开发提供“思考增强”AI服务的SaaS平台,按令牌使用收费。像Anthropic和OpenAI这样的公司已在像Claude和GPT-4的产品中整合这些,创造竞争优势。监管考虑,如2024年欧盟AI法案,强调高风险AI系统的透明度,要求企业记录缩放方法以合规。道德上,最佳实践涉及审计扩展推理放大的偏差,确保公平结果。

未来展望

展望未来,第二缩放定律中平台期的缺失预测向混合缩放模型的转变,结合预训练与动态推理。到2030年,这可能导致AI系统在专业领域与人类专家匹敌,根据斯坦福大学2024年AI指数的预测。行业转变可能有利于专注于高效计算的初创企业,而像Google和Meta这样的关键玩家投资硬件优化。然而,道德影响要求警惕监督,以防止在敏感领域的滥用。

常见问题

什么是AI中的第二缩放定律?

第二缩放定律指通过增加推理时计算(如添加思考令牌)获得的性能增益,如Ethan Mollick的2026年分析和英国AISI更新所述。

添加思考令牌如何改善LLM性能?

通过启用思维链推理,模型分解复杂问题,导致在数学和科学等任务中更高的准确性,根据最近报告无观察到平台期。

这一趋势的商业机会是什么?

企业可以通过增强AI工具用于决策来货币化,市场增长由Gartner预测,聚焦金融和研发等领域。

实施思考令牌有哪些挑战?

是的,包括更高成本和延迟,但优化库等解决方案根据行业实践予以解决。

有哪些道德考虑?

潜在偏差放大要求审计,与欧盟AI法案等法规一致以负责部署。

Ethan Mollick

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech