Claude Sonnet 4.5:AI编码和代理能力的新突破 - Blockchain.News

Claude Sonnet 4.5:AI编码和代理能力的新突破

realtime news Oct 30, 2025 10:53

Anthropic 推出了 Claude Sonnet 4.5,这是一款最新的AI模型,在编码、复杂任务管理和对齐方面提供了显著的进步,承诺在各个领域提高生产力。

Claude Sonnet 4.5:AI编码和代理能力的新突破

Anthropic 推出了 Claude Sonnet 4.5,这是一款突破性的AI模型,有望重新定义编码和复杂代理创建的格局。根据 Anthropic 的说法,该模型旨在在现实世界的软件编码任务中表现出色,在推理、数学和计算机使用方面提供了重大改进。

革新编码和任务管理

Claude Sonnet 4.5 被誉为最先进的编码模型,能够在超过30小时的复杂任务中保持专注。它在 OSWorld 的现实世界计算任务基准测试中名列前茅,其性能指标较之前的 Sonnet 4 显著提高。

除了其编码能力之外,该模型还为 Anthropic 的产品引入了重大升级。它支持 Claude Code 的新功能,如进度保存检查点和本机 VS Code 扩展。该模型还通过上下文编辑功能增强了 Claude API,使代理能够处理更复杂的操作。

扩展开发者工具和基础设施

开发者现在可以通过 Claude Agent SDK 访问与 Claude Code 背后的相同基础设施以构建自己的代理。该工具包承诺超越编码,为各种复杂任务提供强大的解决方案。

此外,Claude Sonnet 4.5 可通过 Claude API 集成,保持之前每百万个令牌$3/$15的定价模式,从而保证开发者的成本效益扩展性。

增强的对齐和安全性

Claude Sonnet 4.5 不仅关注能力,还关注对齐问题。它代表了 Anthropic 的最对齐模型,在行为方面有改进,减少了如迎合和权力追求的问题。该模型在 AI Safety Level 3 保护下发布,包含分类器来检测潜在有害输入,尤其是关于化学、生物、放射和核风险的内容。

对各行业的广泛影响

金融、法律和 STEM 领域的早期采用者报告称,在领域特定知识和推理方面有显著改进。该模型在软件开发任务中的能力也受到赞扬,降低了错误率并提高了开发速度。

此外,Claude Sonnet 4.5 在网络安全方面表现出色,生成创新的攻击场景以改善防御策略。其在复杂金融分析和诉讼任务中的效率凸显了其多元性和潜在影响。

Anthropic 继续创新,提供了一个名为"Imagine with Claude"的临时研究预览,展示了该模型实时生成软件的能力,进一步展示了其潜力。

Image source: Shutterstock