AI 快讯列表关于 大模型部署
| 时间 | 详情 | 
|---|---|
| 
                                        2025-08-12 21:05  | 
                            
                                 
                                    
                                        Anthropic安全团队如何识别AI模型滥用并加强防护:2025年关键洞察
                                    
                                     
                            据Anthropic官方推特(@AnthropicAI)发布,Anthropic的安全团队通过主动监测、红队测试和用户反馈分析,有效识别AI模型潜在滥用并构建多层防护机制(来源:https://twitter.com/AnthropicAI/status/1955375055283622069)。这些措施帮助企业在应用生成式AI时降低安全和合规风险,提升模型部署的可靠性。对于大模型落地企业来说,Anthropic的防护策略强调了AI安全实践的重要性,有助于品牌形象维护和满足监管要求。  | 
                        
| 
                                        2025-08-05 17:26  | 
                            
                                 
                                    
                                        OpenAI研究:对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限
                                    
                                     
                            根据OpenAI(@OpenAI)发布的消息,通过对开源大语言模型gpt-oss-120b进行对抗性微调后,尽管采用了强健的微调方法,该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核,提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步,对于希望应用开源AI系统的企业和开发者来说,具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。(来源:openai.com/index/estimating-...)  |