快讯列表

关于 越狱防护 的快讯列表

时间 详情
2025-10-27
10:00
OpenAI 发布 GPT-5 系统卡附录:敏感对话与越狱防护三大基准,交易者要点

据 OpenAI,GPT-5 在处理敏感对话方面提升明显,并新增情绪依赖、心理健康安全与越狱防护等基准(来源:OpenAI)。OpenAI 表示,该附录仅聚焦安全评估,未披露发布时间、定价、API 政策变化或产品路线(来源:OpenAI)。OpenAI 亦未提及任何加密或区块链集成、代币计划或链上功能,显示本文件未提供直接的加密市场催化剂(来源:OpenAI)。据 OpenAI,重点可量化领域包括情绪依赖交互、心理健康指导约束与防越狱能力(来源:OpenAI)。OpenAI 未公布与这些安全更新相关的合作或变现调整(来源:OpenAI)。

来源
2025-09-16
16:19
Meta 推出 LlamaFirewall:开源 LLM 代理安全工具包,月活不超7亿项目可免费用

根据 @DeepLearningAI,Meta 发布了 LlamaFirewall,这是一套用于保护大语言模型代理免受越狱、目标劫持以及利用生成代码漏洞攻击的开源工具包。来源: DeepLearning.AI 推文 https://twitter.com/DeepLearningAI/status/1967986588312539272;DeepLearning.AI The Batch 摘要 https://www.deeplearning.ai/the-batch/meta-releases-llamafirewall-an-open-source-defense-against-ai-hijacking/ 该工具包可供月活跃用户不超过7亿的项目免费使用,这是公告中的表述。来源: DeepLearning.AI 推文 https://twitter.com/DeepLearningAI/status/1967986588312539272;DeepLearning.AI The Batch 摘要 https://www.deeplearning.ai/the-batch/meta-releases-llamafirewall-an-open-source-defense-against-ai-hijacking/

来源
2025-08-22
16:19
Anthropic宣布从AI训练集移除CBRN危险信息以防越狱泄露:AI概念币交易要点

据Anthropic称,其正在测试从AI训练数据中移除危险的CBRN信息,以便即使模型被越狱也无法获得相关敏感内容。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。 Anthropic表示,这是一种在源头对训练语料进行数据净化的路径,侧重剔除危险CBRN材料,而非仅依赖下游安全训练,目标是降低模型被滥用的风险。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。 该帖未披露具体数据集、落地时间表或产品发布信息,使得与AI叙事相关的加密市场短期催化尚不明确。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。 关注AI安全主题的交易者可跟踪Anthropic后续的说明或发布,以获取可能影响AI概念数字资产仓位的信号。来源:Anthropic (@AnthropicAI) 在X,2025年8月22日。

来源