MMLU AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 MMLU

时间 详情
2026-04-12
16:53
DeepSeek V4 重磅分析:万亿参数MoE、百万Token上下文、昇腾950PR全链路支持与35倍推理提速

根据 God of Prompt 在X上的转述(来源引用@向向103),DeepSeek V4 预计于2026年4月下旬发布,采用万亿参数MoE架构,推理激活约370亿参数,声称推理速度提升35倍、能耗降低40%,并提供100万Token无损上下文与原生多模态(文本、图像、视频、音频)(来源:God of Prompt 在X的贴文引用@向向103)。据该来源称,V4 在华为昇腾950PR上实现训练与推理全链路适配,算力利用率约85%,部署成本为英伟达方案的三分之一,且推理成本约为GPT4的七十分之一,这对高吞吐企业应用的总体拥有成本优化具有显著意义(来源:God of Prompt 在X的贴文)。同一贴文还称其基准成绩包括 AIME 2026 达99.4%、MMLU 92.8%、SWE Bench 83.7%、HumanEval 90%,并支持338种编程语言,同时引入自研 mHC 架构与 Engram 记忆模块以进一步降低推理成本(来源:God of Prompt 在X的贴文引用@向向103)。按照该发布计划,官方已上线网页端快速与专家模式、API兼容OpenAI格式并向新用户赠送500万免费Token,且计划开源权重与支持本地部署;若上述信息得到官方证实,企业可在多语言编程助手、百万Token级RAG知识库、以及低成本视频音频多模态代理等场景抓住商机(来源:God of Prompt 在X的贴文引用@向向103)。