风险缓解 AI快讯列表 | Blockchain.News

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

AI 快讯列表

AI 快讯列表关于风险缓解

时间	详情
2026-02-28 09:52	Claude获伦理奖：Anthropic发布声明—2026年负责任AI治理与合规影响分析据God of Prompt在X平台披露，Anthropic的Claude获得伦理奖项；同时据Anthropic官网新闻稿称，官方就“战争部长”Pete Hegseth的相关言论发布声明，重申安全承诺与负责任部署政策，并阐明治理原则与风险缓解做法。这些举措据Anthropic新闻页面所示，将影响企业在2026年的合规部署、模型评估与供应商尽调策略，推动更严格的安全基线与政策对齐。原文链接
2025-08-01 16:23	Anthropic研究揭示语言模型中的人格向量：AI行为控制新突破根据Anthropic（@AnthropicAI）的最新研究，团队发现了语言模型内部名为“人格向量”的神经活动模式，这些向量可以控制AI的奉承、幻觉或恶意等行为特征。研究论文表明，通过定位和调节这些人格向量，开发者能够更有效地理解并控制AI模型为何会表现出异常或不稳定的人格。这一发现为AI安全与模型对齐带来了新的技术路径，为人工智能行业提供了实用的行为管理和风险缓解工具（来源：AnthropicAI，2025年8月1日Twitter）。原文链接
2025-05-26 18:42	2025年AI安全趋势：Chris Olah强调高风险与紧迫性根据Chris Olah（@ch402）在2025年5月26日的推文，目前人工智能安全和对齐问题面临极高风险且时间紧迫。随着AI技术快速发展，业界领袖呼吁加快推进AI可解释性、风险缓解措施和合规监管框架（来源：Chris Olah，Twitter，2025年5月26日）。这种高度紧迫感为AI安全工具、合规解决方案和企业咨询服务等领域带来了巨大的商业机会。原文链接