Place your ads here email us at info@blockchain.news
阿里巴巴在NVIDIA平台上推出先进的Qwen3-Next AI模型 - Blockchain.News

阿里巴巴在NVIDIA平台上推出先进的Qwen3-Next AI模型

realtime news Sep 16, 2025 12:31

阿里巴巴推出具有混合MoE架构的Qwen3-Next模型,在NVIDIA的先进平台上提高了AI的效率和性能。

阿里巴巴在NVIDIA平台上推出先进的Qwen3-Next AI模型

阿里巴巴推出了两个新的开源AI模型,Qwen3-Next 80B-A3B-Thinking和Qwen3-Next 80B-A3B-Instruct,展示了混合专家模型(MoE)架构。据NVIDIA报道,这些模型在NVIDIA的尖端平台上部署时,承诺提高准确性并加速处理。

提高的效率和性能

Qwen3-Next模型经过设计,能够高效处理大量文本序列。每个模型包含800亿参数,但由于MoE架构,每个标记仅激活30亿个参数。该设计使模型在具有大规模模型的能力的同时,保持小规模模型的效率。此架构包括512个路由专家和一个共享专家,每个标记激活10个专家。

这些模型针对长上下文进行优化,能够处理超过260,000个标记的输入。它们利用NVIDIA的Blackwell第五代NVLink,提供1.8 TB/s的直接GPU到GPU带宽,这对于在复杂处理任务中减少延迟和提高标记吞吐量至关重要。

创新的架构特征

这些模型包括48层,每四层使用全球查询注意(GQA),而其他层采用线性注意。这种创新结合使得模型能够有效分配输入序列中每个标记的重要性。由NVIDIA研究和MIT开发的门控Delta网络,进一步增强了模型对长序列的高效处理能力,确保最小漂移和改进的聚焦。

部署和可访问性

在部署方面,NVIDIA与SGLang和vLLM等开源框架合作。这种合作促进了模型在各种平台上的部署,为开发人员提供了灵活性和访问权限。模型可以通过NVIDIA的NIM微服务端点获得,使企业开发人员能够实验这些先进的AI模型。

对开源AI的承诺

阿里巴巴和NVIDIA对Qwen3-Next模型的倡议体现了通过开源贡献推进AI的承诺。这种方法营造了一个协作环境,研究人员和开发人员可以探索和创新,推动AI技术的未来发展。

Qwen3-Next模型可在Open Router等平台上测试,并可从如Hugging Face的存储库中下载,为AI社区中的进一步实验和开发提供了充分的机会。

Image source: Shutterstock