Hermes AI代理在NVIDIA RTX和DGX Spark上本地运行

Hermes是由Nous Research开发的一款突破性自我进化型AI代理，现在已针对NVIDIA RTX电脑、PRO工作站和DGX Spark系统的本地使用进行了优化。在2026年5月13日发布的公告中，Hermes利用NVIDIA硬件和最新的Qwen 3.6大语言模型（LLMs），在自主工作流程中提供卓越性能。

自发布以来，Hermes已取得显著进展，在不到三个月内GitHub星标数突破14万，并成为OpenRouter统计中最广泛使用的代理。Hermes致力于编写和优化自身技能，以其可靠、始终在线的性能脱颖而出，是开发者和AI爱好者寻找强大本地代理解决方案的首选。

Hermes的独特之处

Hermes引入了多个突出的功能，使其与现有的代理框架区别开来：

自我进化技能：该代理能够自主学习和改进，根据复杂任务和用户反馈优化自身技能。
独立的子代理：任务被分割成短生命周期的子代理，减少混乱并优化资源分配。
优化的可靠性：每个工具和插件都经过Nous Research严格测试，即使在大型本地模型上也能确保无缝运行。
框架的优越性：开发者测试表明，得益于其主动协调层，Hermes的性能始终优于竞争代理。

这些功能使Hermes非常适合7天24小时的本地部署，NVIDIA RTX GPU为其释放潜力提供了强大的计算能力。

Qwen 3.6：本地AI性能的飞跃

Hermes依赖于阿里巴巴最新的Qwen 3.6模型，这些模型以显著更小的内存占用超越了上一代模型性能。Qwen 3.6 35B模型的性能可与旧的120B参数模型相媲美，但仅需20GB内存。同样，27B版本的准确性可达到400B参数模型的水平，但规模仅为其一小部分。

这些优化针对NVIDIA硬件的模型，使Hermes能够快速高效地处理复杂任务。NVIDIA的Tensor Core进一步提升了性能，减少延迟并提高多步骤工作流程和自我改进任务的吞吐量。

为什么DGX Spark是理想的宿主

对于寻求一体化解决方案的用户而言，NVIDIA DGX Spark为代理型AI提供了无与伦比的支持。拥有128GB统一内存和1 Petaflop的AI性能，DGX Spark能够在连续高需求环境中持续运行Hermes及其他AI代理。它尤其适合开发者在运行像Qwen 3.6这样先进模型的同时处理多个工作负载。

对于初学者，NVIDIA通过其“动手构建AI”系列提供了详细的手册和实践课程。这些资源指导用户在DGX Spark上部署Hermes，并利用工具如LM Studio和Ollama实现无缝集成。

如何开始

Hermes是开源的，可在其GitHub存储库上获取。结合NVIDIA RTX GPU或DGX Spark系统，它为开发者和AI爱好者探索本地自主代理的前沿提供了一个便捷的切入点。

随着对自我进化AI需求的增长，Hermes凭借其适应性、可靠性和本地优先的设计，成为下一波AI创新中的重要参与者。

Image source: Shutterstock

Bookmark

Hermes AI代理在NVIDIA RTX和DGX Spark上本地运行

Hermes的独特之处

Qwen 3.6：本地AI性能的飞跃

为什么DGX Spark是理想的宿主

如何开始

Premium Sponsors

Flash News