最新更新
4/1/2026 1:48:00 PM

Anthropic Claude AI 代码泄露暴露核心思维秘密

Anthropic Claude AI 代码泄露暴露核心思维秘密

Anthropic 面临反弹,Claude AI 源代码泄露,揭示了其宪法性思维架构的 5 个爆炸性洞见,AI 安全担忧加剧。

原文链接

详细分析

昨天,Anthropic 的 Claude AI 源代码爆炸性泄露震撼了科技界,不仅暴露了代码行,还揭示了模型复杂的思维过程。@FuSheng_0306 的病毒式 Twitter 帖子声称,一个由 30,000 名审阅者组成的团队剖析了整个代码库,发现了五个爆炸性发现,深入探讨了 Claude 的核心逻辑。

揭示宪法性 AI 基础

Anthropic 在 2022 年开创了宪法性 AI,嵌入指导模型平衡帮助性和无害性的原则。此次泄露暴露了 Claude 如何根据这些规则评估输出,减少回避并解释对有害查询的反对。专家警告,这种暴露可能使竞争对手能够复制或利用这些机制,回荡了几天前吸引数百万浏览量的泄露事件。

安全影响激增,因为代码揭示了 Anthropic 的担忧:用户可能理解 AI 的“思维”而非单纯编程。将此与最近的 AI 进步相结合,此事件突显了专有技术的漏洞,可能影响加密-AI 集成,其中安全模型驱动区块链创新。

行业涟漪

分析师将此与更广泛的 AI 伦理辩论联系起来,敦促加强防护。该帖子积累了大量关注,标志着对 Anthropic 等 AI 巨头的审查日益增加。


傅盛

@FuSheng_0306

Chairman and CEO of Cheetah Mobile, Chairman of OrionStar