AI 快讯列表关于 开源AI模型
| 时间 | 详情 |
|---|---|
|
2025-10-29 12:13 |
OpenAI发布GPT-OSS-Safeguard:两款开源AI安全分类模型助力企业合规
根据OpenAI官方推特(@OpenAI),OpenAI正式推出GPT-OSS-Safeguard研究预览版,包含两款专为安全分类设计的开源AI推理模型。这些模型为企业提供了可透明定制的安全层,广泛适用于自动内容审核、风险检测与合规监测等应用场景。开放权重的模式有助于开发者根据实际业务需求进行微调和集成,推动AI安全解决方案的创新和协作。此举响应了市场对可信AI系统的强烈需求,为专注AI合规与伦理的企业带来巨大的商业机会(来源:https://openai.com/index/introducing-gpt-oss-safeguard/)。 |
|
2025-10-17 12:51 |
Google DeepMind C2S-Scale 27B开源AI模型助力发现新型癌症治疗路径,推动精准医疗创新
据Google DeepMind官方消息,其基于Gemma开源模型家族开发的C2S-Scale 27B AI模型,成功识别出能够躲避免疫系统的癌细胞,并发现了新的癌症治疗潜在路径(来源:@GoogleDeepMind)。该假说已经与耶鲁大学科学家共同在实验室中得到了验证,展示了AI在加速癌症药物研发和肿瘤学研究中的实际应用价值。C2S-Scale 27B模型的应用为制药企业和生物科技公司在精准医疗和免疫治疗领域带来了全新商业机会。 |
|
2025-09-24 21:28 |
Meta FAIR发布32B参数Code World Model (CWM):推动AI代码生成与推理新突破
根据@AIatMeta消息,Meta FAIR正式发布了Code World Model(CWM),这是一款拥有320亿参数的研究型AI模型,旨在探索世界模型在代码生成和程序推理中的变革潜力(来源:ai.meta.com/research/publications/cwm)。CWM以开源权重和代码形式对研究社区开放,赋能开发者在代码分析、自动化及提升开发效率等领域进行深度创新。这一举措彰显了Meta推动AI软件开发和世界模型研究开放合作的决心(来源:huggingface.co/facebook/cwm, github.com/facebookresearch/cwm)。 |
|
2025-09-22 22:32 |
阿里巴巴发布Qwen3-Next-80B-A3B:支持超长上下文推理的80B参数AI模型
据DeepLearning.AI报道,阿里巴巴推出Qwen3-Next-80B-A3B大模型,具备80亿参数,分为Base、Instruct和Thinking三种变体,并以Apache 2.0开源协议发布。该模型采用混合专家(mixture-of-experts)结构,用门控DeltaNet和门控注意力机制取代传统注意力层,大幅提升长上下文推理速度。模型基于Qwen3数据集的15万亿标记子集训练,并通过GSPO微调,支持多标记预测和最长262,144个token输入,极大增强了企业级生成式AI、文档分析与大规模对话应用的实用性。(来源:DeepLearning.AI Twitter,2025-09-22) |
|
2025-08-21 06:33 |
DeepSeek AI发布V3.1大模型:8400亿Token预训练,长文本处理能力大幅提升
据DeepSeek官方推特(@deepseek_ai)消息,DeepSeek AI正式发布V3.1 Base大模型,继续在8400亿token基础上进行预训练,显著增强了长文本上下文处理能力。本次升级还包括全新分词器和聊天模板的优化,全面提升了对话模型的实际应用表现。V3.1 Base与完整版模型权重已全面开源,为开发者和企业带来更高效的大语言模型部署选择,推动中文AI对话系统和自然语言处理行业的发展(来源:DeepSeek推特,2025年8月21日)。 |
|
2025-08-15 16:32 |
Google DeepMind发布Gemma 3 270M:适用于任务定制微调的小型开放AI模型
根据Google DeepMind官方消息,Gemma开源模型系列迎来新成员Gemma 3 270M(来源:Google DeepMind Twitter,2025年8月15日)。该模型体积小巧,专为任务定制微调设计,并具备强大的指令跟随能力。Gemma 3 270M非常适合企业和开发者在边缘设备及定制工作流中高效部署AI方案,满足对低延迟、可定制AI模型的市场需求,为行业用户加速AI产品开发带来重要机遇。 |
|
2025-08-11 19:45 |
GPT-OSS下载量激增:开源AI模型2025年迎来爆发式增长
根据Greg Brockman (@gdb)在推特上的消息,开源AI语言模型GPT-OSS的初始下载量表现强劲,显示出开发者和企业对开放源码大型语言模型的浓厚兴趣(来源:Greg Brockman,Twitter,2025年8月11日)。这一趋势表明,开源AI解决方案正在快速发展,有望推动技术创新并降低企业应用自然语言处理能力的门槛,为中国本地AI企业提供新的商业机会。 |
|
2025-08-05 17:26 |
GPT-OSS模型免费上线Hugging Face,原生MXFP4量化助力高效AI部署
据OpenAI官方消息,gpt-oss模型现已可在Hugging Face平台免费下载,并内置原生MXFP4量化技术,大幅提升AI部署效率。该技术显著降低了内存和计算资源需求,便于企业和研究机构将大语言模型应用于实际生产和服务场景。OpenAI在其官方博客详细列出首日支持的全部平台和部署方式,为中国本地企业利用最新生成式AI模型带来实际商机(来源:OpenAI,Twitter)。 |
|
2025-08-05 17:26 |
OpenAI研究:对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限
根据OpenAI(@OpenAI)发布的消息,通过对开源大语言模型gpt-oss-120b进行对抗性微调后,尽管采用了强健的微调方法,该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核,提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步,对于希望应用开源AI系统的企业和开发者来说,具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。(来源:openai.com/index/estimating-...) |
|
2025-08-05 17:26 |
OpenAI发布gpt-oss-120b与gpt-oss-20b:开源推理大模型与Apache 2.0许可
根据OpenAI官方推特(@OpenAI),公司发布了两款全新开源权重推理模型——gpt-oss-120b和gpt-oss-20b,并采用Apache 2.0许可证。这两款模型结合开源社区反馈开发,在推理能力和AI安全性方面均取得了重要突破。此次发布为AI开发者和企业提供了高性能、可定制的自然语言处理和推理工具,有助于推动企业自动化、解释性AI和智能决策等领域的创新应用,为中国AI市场带来更多实际商机(来源:OpenAI,2025-08-05)。 |
|
2025-08-05 17:03 |
gpt-oss开源AI模型发布:媲美o4-mini,可在高端笔记本和手机上运行
根据Sam Altman(@sama)在推特上的消息,gpt-oss开源AI模型正式发布,该模型性能与o4-mini相当,并且能够在高端笔记本电脑上高效运行。更小型的版本还可在手机等移动设备上运行,大幅降低了高性能AI的硬件门槛。这一突破为企业和开发者提供了在本地设备部署先进AI技术的机会,推动边缘计算、隐私保护及移动端AI应用的广泛落地(来源:Sam Altman,Twitter,2025年8月5日)。 |
|
2025-07-31 14:08 |
FLUX Krea 超越以往开源模型,接近FLUX Pro质量——AI内部评测揭示新商业机遇
根据@krea_ai发布的消息,FLUX Krea在内部评测中表现优于以往的开源FLUX模型,已接近FLUX Pro的质量水平。这一进步表明开源AI模型的能力正在快速提升,为企业和开发者提供了更高质量且开放的AI解决方案。随着模型性能提升,AI行业企业可在不依赖闭源产品的前提下实现大规模部署和创新,拓展更多业务应用场景(来源:@krea_ai,2025年7月31日)。 |
|
2025-06-26 18:16 |
Gemma 3n:领先的开源AI模型,支持单GPU/TPU,适用于边缘设备
根据Demis Hassabis在推特上的消息,最新发布的开源Gemma 3n模型是目前最强大的单GPU或TPU可运行的AI模型。Gemma 3n不仅具备卓越的多模态理解能力,还能在仅2GB内存环境下高效运行,非常适合边缘计算场景。这一模型的高效能和开源特性,为物联网、智能设备和移动应用等行业的AI边缘部署带来了巨大商业机遇(来源:@demishassabis,2025年6月26日)。 |
|
2025-06-06 17:43 |
DeepSeek-R1-0528开源AI模型性能对标OpenAI和Google,推动企业级人工智能创新
根据DeepLearning.AI报道,DeepSeek发布了其旗舰开源模型DeepSeek-R1-0528的升级版本,在多个行业基准测试中,其表现已可媲美OpenAI的o3和Google的Gemini-2.5 Pro等主流闭源模型。尽管训练细节尚未公开,该模型的进步展示了开源AI模型正逐步缩小与闭源解决方案之间的性能差距。对于需要高透明度和定制化的企业和开发者,DeepSeek-R1-0528为构建高性能、低成本AI应用带来了全新商机。这一趋势标志着企业级AI市场正向开源解决方案转型(来源:DeepLearning.AI,2025年6月6日)。 |