快讯列表

关于 越狱防护 的快讯列表

时间 详情
2025-09-16
16:19
Meta 推出 LlamaFirewall:开源 LLM 代理安全工具包,月活不超7亿项目可免费用

根据 @DeepLearningAI,Meta 发布了 LlamaFirewall,这是一套用于保护大语言模型代理免受越狱、目标劫持以及利用生成代码漏洞攻击的开源工具包。来源: DeepLearning.AI 推文 https://twitter.com/DeepLearningAI/status/1967986588312539272;DeepLearning.AI The Batch 摘要 https://www.deeplearning.ai/the-batch/meta-releases-llamafirewall-an-open-source-defense-against-ai-hijacking/ 该工具包可供月活跃用户不超过7亿的项目免费使用,这是公告中的表述。来源: DeepLearning.AI 推文 https://twitter.com/DeepLearningAI/status/1967986588312539272;DeepLearning.AI The Batch 摘要 https://www.deeplearning.ai/the-batch/meta-releases-llamafirewall-an-open-source-defense-against-ai-hijacking/

来源
2025-08-22
16:19
Anthropic宣布从AI训练集移除CBRN危险信息以防越狱泄露:AI概念币交易要点

据Anthropic称,其正在测试从AI训练数据中移除危险的CBRN信息,以便即使模型被越狱也无法获得相关敏感内容。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。 Anthropic表示,这是一种在源头对训练语料进行数据净化的路径,侧重剔除危险CBRN材料,而非仅依赖下游安全训练,目标是降低模型被滥用的风险。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。 该帖未披露具体数据集、落地时间表或产品发布信息,使得与AI叙事相关的加密市场短期催化尚不明确。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。 关注AI安全主题的交易者可跟踪Anthropic后续的说明或发布,以获取可能影响AI概念数字资产仓位的信号。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。

来源