能力评估 AI快讯列表

AI 快讯列表

AI 快讯列表关于能力评估

时间	详情
2026-05-14 04:29	METR与AISI指示AI加速拐点据@emollick称，METR与英国AISI评估显示AI已越过拐点并加速。原文链接
2025-08-05 17:26	OpenAI研究：对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限根据OpenAI（@OpenAI）发布的消息，通过对开源大语言模型gpt-oss-120b进行对抗性微调后，尽管采用了强健的微调方法，该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核，提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步，对于希望应用开源AI系统的企业和开发者来说，具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。（来源：openai.com/index/estimating-...）原文链接

时间

详情

2026-05-14
04:29

METR与AISI指示AI加速拐点

据@emollick称，METR与英国AISI评估显示AI已越过拐点并加速。

原文链接

2025-08-05
17:26

OpenAI研究：对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限

根据OpenAI（@OpenAI）发布的消息，通过对开源大语言模型gpt-oss-120b进行对抗性微调后，尽管采用了强健的微调方法，该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核，提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步，对于希望应用开源AI系统的企业和开发者来说，具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。（来源：openai.com/index/estimating-...）

原文链接

AI 快讯列表关于 能力评估

AI 快讯列表关于能力评估