Hermes AI代理在NVIDIA RTX和DGX Spark上本地运行
realtime news May 13, 2026 13:56
Hermes将自我进化的AI代理引入NVIDIA RTX电脑和DGX Spark,利用Qwen 3.6模型实现无与伦比的本地性能。
Hermes是由Nous Research开发的一款突破性自我进化型AI代理,现在已针对NVIDIA RTX电脑、PRO工作站和DGX Spark系统的本地使用进行了优化。在2026年5月13日发布的公告中,Hermes利用NVIDIA硬件和最新的Qwen 3.6大语言模型(LLMs),在自主工作流程中提供卓越性能。
自发布以来,Hermes已取得显著进展,在不到三个月内GitHub星标数突破14万,并成为OpenRouter统计中最广泛使用的代理。Hermes致力于编写和优化自身技能,以其可靠、始终在线的性能脱颖而出,是开发者和AI爱好者寻找强大本地代理解决方案的首选。
Hermes的独特之处
Hermes引入了多个突出的功能,使其与现有的代理框架区别开来:
- 自我进化技能:该代理能够自主学习和改进,根据复杂任务和用户反馈优化自身技能。
- 独立的子代理:任务被分割成短生命周期的子代理,减少混乱并优化资源分配。
- 优化的可靠性:每个工具和插件都经过Nous Research严格测试,即使在大型本地模型上也能确保无缝运行。
- 框架的优越性:开发者测试表明,得益于其主动协调层,Hermes的性能始终优于竞争代理。
这些功能使Hermes非常适合7天24小时的本地部署,NVIDIA RTX GPU为其释放潜力提供了强大的计算能力。
Qwen 3.6:本地AI性能的飞跃
Hermes依赖于阿里巴巴最新的Qwen 3.6模型,这些模型以显著更小的内存占用超越了上一代模型性能。Qwen 3.6 35B模型的性能可与旧的120B参数模型相媲美,但仅需20GB内存。同样,27B版本的准确性可达到400B参数模型的水平,但规模仅为其一小部分。
这些优化针对NVIDIA硬件的模型,使Hermes能够快速高效地处理复杂任务。NVIDIA的Tensor Core进一步提升了性能,减少延迟并提高多步骤工作流程和自我改进任务的吞吐量。
为什么DGX Spark是理想的宿主
对于寻求一体化解决方案的用户而言,NVIDIA DGX Spark为代理型AI提供了无与伦比的支持。拥有128GB统一内存和1 Petaflop的AI性能,DGX Spark能够在连续高需求环境中持续运行Hermes及其他AI代理。它尤其适合开发者在运行像Qwen 3.6这样先进模型的同时处理多个工作负载。
对于初学者,NVIDIA通过其“动手构建AI”系列提供了详细的手册和实践课程。这些资源指导用户在DGX Spark上部署Hermes,并利用工具如LM Studio和Ollama实现无缝集成。
如何开始
Hermes是开源的,可在其GitHub存储库上获取。结合NVIDIA RTX GPU或DGX Spark系统,它为开发者和AI爱好者探索本地自主代理的前沿提供了一个便捷的切入点。
随着对自我进化AI需求的增长,Hermes凭借其适应性、可靠性和本地优先的设计,成为下一波AI创新中的重要参与者。
Image source: Shutterstock