AI 快讯列表关于 参数效率
| 时间 | 详情 |
|---|---|
|
2025-10-30 10:00 |
阿里巴巴发布30B参数通义DeepResearch AI代理,以3.3B有效参数超越GPT-4o与DeepSeek-V3
根据@godofprompt报道,阿里巴巴推出了开源AI代理通义DeepResearch,拥有30B参数,但仅用3.3B有效参数就在深度研究任务上超越了GPT-4o和DeepSeek-V3(来源:https://twitter.com/godofprompt/status/1983836518067401208)。不同于行业普遍追求600B+参数规模,阿里巴巴的创新在于独特的训练范式。通义DeepResearch首创“agentic mid-training”中介阶段,使模型先学会作为智能体的推理方式,再进行具体任务训练,有效解决了传统SFT和RL训练中的对齐冲突。训练数据全部由AI自动生成,无需人工标注,涵盖多跳推理和高复杂度问题。该模型在Humanity's Last Exam(32.9%)、BrowseComp(43.4%)和xbench-DeepSearch(75%)等多个基准测试中取得业界领先成绩。训练仅用2块H100显卡,2天内完成,每项任务成本低于500美元。这一突破为高效低成本AI智能体提供了商业化机会,推动行业从参数规模竞争转向智能训练(来源:arxiv.org/abs/2510.24701;github.com/Alibaba-NLP/DeepResearch)。 |