DeepSeek 685B MoE模型：2-3倍加速长上下文推理，6-7倍降低AI计算成本，专为中国芯片优化

DeepSeek 685B MoE模型：2-3倍加速长上下文推理，6-7倍降低AI计算成本，专为中国芯片优化 | AI快讯详情 | Blockchain.News

根据@DeepLearningAI报道，DeepSeek最新推出的685B专家混合（MoE）大模型采用相关性Token关注机制，实现了2-3倍长上下文推理速度提升，并将处理成本降低6-7倍，相较于上一代V3.1模型（来源：DeepLearning.AI Twitter，2025年10月22日）。V3.2模型权重采用MIT开源协议，通过API收费为每百万输入/缓存/输出Token分别为$0.28/$0.028/$0.42，推动开源和API商业模式发展。该模型专门针对华为及中国本土芯片进行优化，提升本地硬件兼容性。虽然整体性能与V3.1相近，但在代码生成和智能体等任务上略有提升，科学和数学领域略微下降，为中国市场和成本敏感型AI应用带来新商机（来源：DeepLearning.AI，The Batch）。

原文链接

详细分析

DeepSeek最新推出的6850亿参数MoE模型通过仅关注最相关令牌，实现了长上下文推理速度提升2-3倍，并比V3.1模型处理成本降低6-7倍。根据DeepLearning.AI于2025年10月22日的公告，新V3.2模型采用MIT许可权重，通过API定价为每百万输入/缓存/输出令牌0.28/0.028/0.42美元，并针对华为及其他中国芯片优化。性能与V3.1相似，在编码和代理任务上小幅提升，在某些科学和数学领域略有下降。这一发展在AI行业中凸显了高效大模型的趋势，为企业提供更经济的长上下文处理解决方案。在商业应用中，该模型可降低AI部署门槛，推动订阅服务和API货币化策略。实施挑战包括硬件兼容性，但通过混合云解决方案可解决。未来展望显示，此类模型可能主导2027年AI市场，减少运营成本30%。竞争格局中，DeepSeek挑战OpenAI等巨头，促进亚洲AI创新。监管方面需遵守数据隐私法，伦理实践包括偏差审计，以确保公平性。总体而言，这为新兴市场AI采用率提升20%带来机遇。

长上下文推理 DeepSeek 685B MoE模型 AI成本降低 MIT开源权重中国芯片优化 API定价代码生成AI

DeepLearning.AI

@DeepLearningAI

We are an education technology company with the mission to grow and connect the global AI community.