Claude Sonnet 4.5：AI编码和代理能力的新突破

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

Claude Sonnet 4.5：AI编码和代理能力的新突破 - Blockchain.News

Anthropic 推出了 Claude Sonnet 4.5，这是一款突破性的AI模型，有望重新定义编码和复杂代理创建的格局。根据 Anthropic 的说法，该模型旨在在现实世界的软件编码任务中表现出色，在推理、数学和计算机使用方面提供了重大改进。

革新编码和任务管理

Claude Sonnet 4.5 被誉为最先进的编码模型，能够在超过30小时的复杂任务中保持专注。它在 OSWorld 的现实世界计算任务基准测试中名列前茅，其性能指标较之前的 Sonnet 4 显著提高。

除了其编码能力之外，该模型还为 Anthropic 的产品引入了重大升级。它支持 Claude Code 的新功能，如进度保存检查点和本机 VS Code 扩展。该模型还通过上下文编辑功能增强了 Claude API，使代理能够处理更复杂的操作。

开发者现在可以通过 Claude Agent SDK 访问与 Claude Code 背后的相同基础设施以构建自己的代理。该工具包承诺超越编码，为各种复杂任务提供强大的解决方案。

此外，Claude Sonnet 4.5 可通过 Claude API 集成，保持之前每百万个令牌$3/$15的定价模式，从而保证开发者的成本效益扩展性。

Claude Sonnet 4.5 不仅关注能力，还关注对齐问题。它代表了 Anthropic 的最对齐模型，在行为方面有改进，减少了如迎合和权力追求的问题。该模型在 AI Safety Level 3 保护下发布，包含分类器来检测潜在有害输入，尤其是关于化学、生物、放射和核风险的内容。

金融、法律和 STEM 领域的早期采用者报告称，在领域特定知识和推理方面有显著改进。该模型在软件开发任务中的能力也受到赞扬，降低了错误率并提高了开发速度。

此外，Claude Sonnet 4.5 在网络安全方面表现出色，生成创新的攻击场景以改善防御策略。其在复杂金融分析和诉讼任务中的效率凸显了其多元性和潜在影响。

Anthropic 继续创新，提供了一个名为"Imagine with Claude"的临时研究预览，展示了该模型实时生成软件的能力，进一步展示了其潜力。

Image source: Shutterstock