AI 快讯列表关于 阿里巴巴AI
| 时间 | 详情 |
|---|---|
|
2025-11-01 12:25 |
阿里巴巴AgentFold:AI代理人主动上下文管理实现长时记忆突破
根据推特用户God of Prompt报道,阿里巴巴最新发布的论文《AgentFold: Long-Horizon Web Agents with Proactive Context Management》提出了一种类人记忆系统,使AI代理人能在任务中自主决定保留或遗忘哪些信息。传统代理要么累积过多上下文导致混乱,要么过早摘要丢失关键信息,而AgentFold通过主动上下文折叠,实现500多轮对话仅用7K tokens。论文实验证明,AgentFold在长时推理任务中表现优于体量大20倍的DeepSeek-V3.1-671B以及OpenAI的o4-mini。这一创新将AI记忆视为动态工作区,显著提升效率,为企业自动化、智能客服和复杂工作流管理等AI应用场景带来新机遇。(来源:God of Prompt推特,2025年11月1日) |
|
2025-10-30 10:00 |
阿里巴巴发布30B参数通义DeepResearch AI代理,以3.3B有效参数超越GPT-4o与DeepSeek-V3
根据@godofprompt报道,阿里巴巴推出了开源AI代理通义DeepResearch,拥有30B参数,但仅用3.3B有效参数就在深度研究任务上超越了GPT-4o和DeepSeek-V3(来源:https://twitter.com/godofprompt/status/1983836518067401208)。不同于行业普遍追求600B+参数规模,阿里巴巴的创新在于独特的训练范式。通义DeepResearch首创“agentic mid-training”中介阶段,使模型先学会作为智能体的推理方式,再进行具体任务训练,有效解决了传统SFT和RL训练中的对齐冲突。训练数据全部由AI自动生成,无需人工标注,涵盖多跳推理和高复杂度问题。该模型在Humanity's Last Exam(32.9%)、BrowseComp(43.4%)和xbench-DeepSearch(75%)等多个基准测试中取得业界领先成绩。训练仅用2块H100显卡,2天内完成,每项任务成本低于500美元。这一突破为高效低成本AI智能体提供了商业化机会,推动行业从参数规模竞争转向智能训练(来源:arxiv.org/abs/2510.24701;github.com/Alibaba-NLP/DeepResearch)。 |