LangSmith 通过 Insights Agent 和 多轮评估增强代理监控
realtime news Oct 24, 2025 08:05
LangSmith 推出 Insights Agent 和 多轮评估,以增强代理监控并改善用户交互成果,为 AI 团队提供有价值的见解。
LangSmith 推出了旨在提高生产环境中 AI 代理质量和效果的新功能。根据LangChain 的博客,Insights Agent 和 多轮评估的引入标志着在为 AI 团队提供更好地了解代理交互及其成功实现用户目标方面迈出了一大步。
Insights Agent:揭示用户交互模式
Insights Agent 旨在分析和分类用户与 AI 代理的交互模式。随着代理每天生成数百万条交互痕迹,Insights Agent 自动化识别常见行为和失败模式的过程。此功能使 AI 团队可以通过关注真实用户交互并确定需要改进的领域来快速迭代和改进代理性能。
通过根据使用模式对痕迹进行分类或识别负面交互,Insights Agent 提供了用户如何与代理互动的全面视图。这种详细的见解对于优先改进并确保代理有效满足用户期望至关重要。
多轮评估:全面的交互评估
与 Insights Agent 配套的是多轮评估功能,该功能评估代理用户交互的整个轨迹。与传统评估关注单个痕迹不同,多轮评估提供了整体视图,衡量交互是否成功达到了用户的意图。
此功能评估语义意图、任务完成和交互过程中的决策过程等方面。通过将这些交换表示为线程,LangSmith 实现了对会话动态的详细分析,为代理设计和功能的更知情改进铺平了道路。
增强 AI 团队的监控
LangSmith 中的这些更新旨在解决 AI 团队在设计可靠代理时面临的挑战。通过提供有关代理性能和用户满意度的详细见解,LangSmith 为团队提供了所需的工具,以做出基于数据的决策并增强代理的可靠性。
随着这些功能对 LangSmith Plus 和企业云客户的普遍可用性,AI 团队现在可以利用这些工具简化开发过程,并确保其代理不仅能够运行,还能有效实现用户目标。
Image source: Shutterstock