代理工程:弥合开发与生产之间的差距 - Blockchain.News

代理工程:弥合开发与生产之间的差距

realtime news Dec 09, 2025 16:59

代理工程正在成为开发可靠人工智能系统的关键学科。了解它如何结合产品思维、工程和数据科学用于非确定性系统。

代理工程:弥合开发与生产之间的差距

根据LangChain在最近的一篇博文中指出,代理工程被认为是开发可靠AI系统的重要学科。这个新兴领域解决了从开发向生产过渡的挑战,特别是对于依赖大型语言模型(LLM)并表现出非确定性行为的系统。

什么是代理工程?

代理工程被定义为将非确定性LLM系统完善为可靠的生产体验的迭代过程。这个过程是一个周期性的过程,涉及构建、测试、交付、观察、完善和重复等阶段。目标不仅仅是交付一个产品,而是通过了解产品在生产环境中的表现不断改进它。

这个新学科结合了三个关键技能集:

  • 产品思维:涉及定义范围和塑造代理行为。它要求撰写指导代理行动的提示,并理解代理应该完成的任务。
  • 工程:专注于为代理在生产中运行所需的基础设施。这包括开发用户界面以及管理内存和执行。
  • 数据科学:通过A/B测试和错误分析等工具来衡量和改进代理性能,持续改进代理行为。

代理工程的出现和必要性

代理工程的必要性源于两个重要转变。首先,LLM已经能够处理复杂的多步骤工作流程,例如LinkedIn和Clay等公司展示的那样,使用代理从事包括CRM更新到人才库扫描在内的任务。其次,LLM的不可预测性要求一种新方法以确保在生产环境中的可靠性。

代理与传统软件的不同之处在于它们能够以多种方式解释输入并根据上下文自适应。这种灵活性意味着每个用户输入都可能是一个边缘情况,传统的调试方法通常无效。因此,代理工程强调观察现实世界的行为并基于这些观察完善系统。

代理工程的实际应用

在实践中,代理工程涉及构建、测试和完善的循环。最初,工程师必须建立代理的基础架构,无论是简单的LLM调用还是更复杂的系统。针对设想的场景进行测试有助于发现初始问题,但理解实际用户交互需要在真实世界中部署。

对生产中代理性能的持续观察和评估允许系统的系统性改进。这种方法确保代理不仅正确运行,还能提供有意义的商业价值。LangChain指出,成功的团队是那些拥抱快速迭代并将生产视为一个持续学习过程的团队。

工程的新标准

代理工程有望成为AI开发中的标准实践,这由能够可靠处理需要类人判断的任务的系统的需求所驱动。该学科强调从生产中学习和快速迭代以增强代理的可靠性和功能的重要性。

随着组织越来越依赖代理来进行复杂的工作流程,采用代理工程实践将是充分利用LLM潜力并确保生产环境中可信和可靠的关键。

Image source: Shutterstock