第9篇:Vibe Coding时代:LangGraph 可观测性实战,解决 Agent 黑盒运行、无法排查问题一、问题场景:Agent 输出错了,但不知道错在哪一步做 Agent 最痛苦的不是它报错。最痛苦的是:它输出了一个看起来正常但其实错误的结果,而你不知道是哪一步开始错的。比如一个 Coding Agent 流程:需求分析 → 架构设计 → 代码生成 → 测试 → 审查最终代码不符合需求。你需要排查:是需求分析理解错了?是架构设计漏了模块?是代码生成没按架构来?是测试没覆盖?是审查放过了问题?如果没有可观测性,只能靠 print。这在复杂 Agent 项目里完全不够。本文要解决:如何给 LangGraph Agent 加入日志、trace_id、节点耗时、状态快照,让问题可定位。二、可观测性要看什么?一个 Agent 至少要记录: