快讯列表

关于 代理评估 的快讯列表

时间 详情
2025-12-09
19:47
Anthropic披露SGTM研究局限:小模型与代理评估、无法阻止上下文攻击——交易影响解析

据@AnthropicAI称,该SGTM研究基于简化环境,使用小模型并采用代理评估而非标准基准测试,因而对生产级系统的外推有限,来源:https://twitter.com/AnthropicAI/status/1998479616651178259。据@AnthropicAI称,SGTM无法阻止由对手在提示中直接提供信息的上下文攻击,显示模型滥用风险仍未解决,来源:https://twitter.com/AnthropicAI/status/1998479616651178259。据@AnthropicAI称,该帖未提供标准基准结果,也未提及金融或加密资产,本次更新未指向任何直接的加密市场催化因素,来源:https://twitter.com/AnthropicAI/status/1998479616651178259。

来源