阿里巴巴在NVIDIA平台上推出先进的Qwen3-Next AI模型

阿里巴巴在NVIDIA平台上推出先进的Qwen3-Next AI模型 - Blockchain.News

阿里巴巴推出了两个新的开源AI模型，Qwen3-Next 80B-A3B-Thinking和Qwen3-Next 80B-A3B-Instruct，展示了混合专家模型（MoE）架构。据NVIDIA报道，这些模型在NVIDIA的尖端平台上部署时，承诺提高准确性并加速处理。

提高的效率和性能

Qwen3-Next模型经过设计，能够高效处理大量文本序列。每个模型包含800亿参数，但由于MoE架构，每个标记仅激活30亿个参数。该设计使模型在具有大规模模型的能力的同时，保持小规模模型的效率。此架构包括512个路由专家和一个共享专家，每个标记激活10个专家。

这些模型针对长上下文进行优化，能够处理超过260,000个标记的输入。它们利用NVIDIA的Blackwell第五代NVLink，提供1.8 TB/s的直接GPU到GPU带宽，这对于在复杂处理任务中减少延迟和提高标记吞吐量至关重要。

这些模型包括48层，每四层使用全球查询注意（GQA），而其他层采用线性注意。这种创新结合使得模型能够有效分配输入序列中每个标记的重要性。由NVIDIA研究和MIT开发的门控Delta网络，进一步增强了模型对长序列的高效处理能力，确保最小漂移和改进的聚焦。

在部署方面，NVIDIA与SGLang和vLLM等开源框架合作。这种合作促进了模型在各种平台上的部署，为开发人员提供了灵活性和访问权限。模型可以通过NVIDIA的NIM微服务端点获得，使企业开发人员能够实验这些先进的AI模型。

阿里巴巴和NVIDIA对Qwen3-Next模型的倡议体现了通过开源贡献推进AI的承诺。这种方法营造了一个协作环境，研究人员和开发人员可以探索和创新，推动AI技术的未来发展。

Qwen3-Next模型可在Open Router等平台上测试，并可从如Hugging Face的存储库中下载，为AI社区中的进一步实验和开发提供了充分的机会。

Image source: Shutterstock