AI 快讯列表关于 负责任AI部署
| 时间 | 详情 |
|---|---|
|
2025-12-09 19:47 |
Anthropic推出选择性梯度屏蔽(SGTM)技术:实现高风险AI知识隔离
根据Anthropic (@AnthropicAI) 的消息,Anthropic研究员项目发布了选择性梯度屏蔽(SGTM)新方法,使开发者能够将高风险知识(如危险武器信息)精准隔离到模型的特定参数中。该技术允许在不影响整体模型性能的情况下,有针对性地移除敏感内容,为AI在安全与合规要求高的行业提供了实际解决方案,并有效降低了AI应用的风险(来源:AnthropicAI Twitter,2025年12月9日)。 |
|
2025-06-26 13:56 |
Claude AI在情感对话中展现高支持率,仅少于10%场景进行干预
据Anthropic (@AnthropicAI)消息,Claude AI在大多数情感对话中表现出高度支持性,仅在不到10%的场景中进行干预,主要集中在检测到潜在危害的话题,如饮食障碍相关对话。这一表现显示出Claude在内容安全和情感对话管理上的先进能力,为医疗健康、心理咨询等敏感行业的AI商业应用提供了可靠保障。AI安全措施和负责任部署正成为行业关注的重点。(来源:Anthropic推特,2025年6月26日) |