Agent架构设计的三层分类体系与实践
思考在agent开发浪潮下经历过知识库构建 rag 图谱reAct Agent openclaw caludecode 企业内部自主规划agent、有明确复杂拓扑限制的Agent做了这么多在做分析、重构、新任务时不由的思考这些架构模式有何异同点随着openclaw harmessagentlanggraph 搭建的拓扑规则会丢掉吗 自主规划agent是否会全代替掉有人交互的agent。 因此在做技术重构之前思考得到了这篇文章 与当下大多数分析的简单的划分不一样文章从业务分类到编排模式做了详尽科学的分析。市面上大多简单的分为 ReAct 、 plan-execute、Reflection、多agent架构本事缺少最重要的AI是效能 从业务上区分好才能真正的理解运用做好技术架构考虑到脱敏本文章仅仅做大致方案不会去讲述具体如何做企业级落地实际方案摘要与主结论核心结论整体研究方向将业务分类“编排模式”能力构件三层拆分解耦避免抽象层混淆企业级AI应用架构定位采用人机在环、可中断、可恢复、可审计的workflow方案OpenAI Deep Research 架构定位核心研究引擎更接近自主规划类Agent但在交互壳层又明显带有人机在环workflow的特征核心主线结合Anthropic、LangChain、Google Cloud、Microsoft及AWS的官方材料核心主线均为先用足够简单的系统仅在复杂度能带来明确收益时再升级到更agentic的方案避免过度设计一、术语与分层坐标系1.1 三层分类体系层级核心问题典型选项作用第一层交互与控制权谁主导流程人主导、Agent主导、混合主导业务视角的核心分类依据第二层编排方式流程如何执行固定流程、动态推理循环、单Agent或多Agent协作工程实现的核心维度第三层能力与治理具备哪些支撑能力工具调用、记忆、反思、审批、观测、恢复横切能力可按需组合到不同编排方式中1.2 核心术语对齐术语定义备注Workflow预定义代码路径、显式状态与流程约束的系统强调可控性与可审计性Agent模型动态决定流程与工具使用的系统强调自主性与适应性Agentic Node嵌入workflow中的具备局部推理能力的节点平衡可控性与智能性HITL (Human-in-the-loop)人机在环保留人工介入点的系统确保关键决策可审阅、可接管二、三类业务架构2.1 自主规划类AgentAutonomy-First Agent定义以模型自主决策为主、以动态路径为主的Agent在人类给出目标、工具权限与边界条件后Agent自主分解问题、选择工具、决定下一步执行动作核心是弱流程约束下的自主闭环。核心特征控制权Agent主导人类仅输入目标、设定边界不参与中间执行步骤编排方式动态推理循环可采用ReAct式的推理—行动循环或Plan-then-Execute先规划再执行变体核心能力具备自主问题拆分、工具选择、多步骤连贯执行能力可搭配记忆、反思等横切能力风险点可控性较弱易出现推理偏差缺乏强流程约束不适用于强合规场景适配场景目标模糊、任务周期长且无需强流程约束的场景例如会议调研、多文档汇总、复杂信息整理、跨部门任务统筹等。2.2 轻量语义辅助类Agent语义路由/语义工具助手定义不强调完整Agent属性更接近tool-augmented assistant或语义路由节点核心功能是意图识别、槽位抽取、结构化输出、单次工具调用或单轮检索实现单轮交互闭环。核心特征控制权人类主导需每次输入单一指令Agent仅负责响应指令不具备自主决策能力编排方式单步执行无复杂流程采用单轮请求—单轮响应的交互模式核心能力具备基础语义解析、单次工具调用能力可按需搭配会话级有限记忆风险点功能单一无法承载复杂业务链路仅能满足简单即时需求适配场景简单问答、单一工具查询、短会话交互等场景例如简单会议信息查询、基础业务咨询、一次性数据检索等。2.3 人机交互Workflow Agent人机在环工作流编排系统定义以workflow为核心内部嵌入agentic节点如ReAct、planner等构建用户主导、AI辅助的交互模式核心价值来自共享状态、interrupt、checkpoint、resume、trace和approval。核心特征控制权人类主导Agent承担辅助执行职责不突破预设流程边界编排方式固定流程预定义路径可通过StateGraph等机制承载子图与分支支持流程中断与恢复核心能力具备上下文记忆、多轮人机穿插交互、操作审计、断点恢复能力可嵌入agentic节点提升智能辅助水平风险点自动化程度低于自主规划类Agent流程固定、灵活度有限前期需完成完善的流程编排设计适配场景企业级强交互、强约束长会话场景例如审批流程、企业级客服、长周期业务跟进等需多步骤人机穿插操作、且要求流程可控可审计的业务场景。三、常见Agent模式与能力构件3.1 编排模式模式核心功能适配场景ReAct推理—行动—观察循环自主规划类Agent中最常见的执行环之一简单任务与即时响应场景Plan-then-Execute先规划后执行包括Plan-and-Solve、ReWOO等变体复杂、多步骤、长周期任务Reflection / Evaluator-Optimizer / Critic Loop评审—修正循环通过自我校验与迭代优化输出结果对结果准确性、严谨性要求较高的任务Hierarchical分层智能体架构上层为总控Agent下层为子Agent超复杂、多领域融合任务Routing语义路由根据用户意图将任务分发到对应Agent或工具多场景分流Parallelization并行执行多子任务提升复杂任务处理效率多维度同步分析场景顺序工作流/Prompt Chaining按预定义顺序执行多步任务无动态分支简单固定流程Orchestrator-Workers/Coordinator协调者—工作者模式类似Hierarchical的简化版多子任务协同Swarm/Collaboration多Agent去中心化协作无明确总控分布式复杂任务Human-in-the-loop/Custom Logic人机在环逻辑嵌入人工审批、干预节点强合规场景3.2 横切能力能力定义适用场景工具调用能力接口契约和执行能力所有架构类型Memory记忆横切能力分为短期记忆会话级、长期记忆持久化自主规划类、Workflow类观测监控、日志、追踪、调试所有架构类型审批人工审阅、审批、接管Workflow类核心恢复断点恢复、故障回溯Workflow类限流、重试流量控制、错误处理所有架构类型3.3 设计原则组合原则大多数真实系统都会混合多种模式组合不是例外而是常态。四、企业级AI应用落地架构4.1 核心定义企业级AI应用建议定义为以显式状态图为核心的人机在环工作流系统内部嵌入局部agentic子图。这一定义既保留AI辅助可控合规的核心需求又严格区分workflow与agent的术语边界避免混淆。4.2 四层架构设计层级职责核心组件交互层用户操作入口点击触发、自然语言补充、暂停/恢复操作、审批确认、结果反馈用户点击节点、自然语言输入节点、流程控制节点编排层用StateGraph或类似机制承载子图与分支定义流程路径、子图触发条件、分支逻辑子图A确定性工作流、子图BBounded ReAct状态层保存全局共享状态业务数据、筛选条件、执行进度、操作证据和审计日志共享图状态、线程级检查点、可选长期记忆工具与治理层工具调用数据检索、摘要生成、导出等、治理控制限流、重试、权限管控、观测回溯工具调用、审批机制、观测系统、回溯能力4.3 子图设计子图A点击触发链路核心功能点击触发检索、列表刷新、条件筛选工程实现确定性工作流节点或受约束工具流映射模式顺序工作流/Prompt Chaining 工具调用能力子图B自然语言处理链路核心功能处理自然语言意图如仅筛选复盘类会议工程实现Bounded Planner/Router 或 Bounded ReAct Node映射模式Routing Bounded ReAct Plan-then-Execute计划机制特点明确输入边界、最大工具调用次数、失败回退机制和人工接管边4.4 状态与记忆管理表述为共享图状态 线程级检查点 可选长期记忆——LangGraph文档明确区分state、thread、checkpoint、short-term memory、long-term memory该表述可同时解释中断恢复、多轮交互、故障恢复与审计回放更贴合工程实现。五、OpenAI Deep Research架构深度解析5.1 核心定位与架构特征OpenAI Deep Research是一个agentic、multi-step、tool-using、planning-heavy、citation-backed的研究系统核心功能是完成深度研究任务并输出带引用的结构化报告。5.2 架构分层分析基于官方公开资料5.2.1 官方明确确认的部分有公开文档支撑能力维度官方确认内容对应架构模式核心定位agentic、multi-step、tool-using、planning-heavy、citation-backed的研究系统自主规划类Agent核心规划能力会先生成结构化研究计划Research Plan用户可修改计划、限定可用来源、查看进度并随时打断Plan-then-Execute模式工具调用在API与产品层均会自主分解子问题、调用web search、code interpreter、MCP/file search等工具形成工具调用闭环ReAct循环交互控制ChatGPT产品层包有一层用户控制流程支持审阅计划、中断执行、重定向任务带有明显的人机在环特征HITL Workflow壳层输出特征返回带内联引用的结构化报告暴露reasoning summary、搜索调用和代码执行等中间步骤具备基础校验与可追溯能力Reflection/Evaluator-Optimizer优化方式采用与o1相同的强化学习方法在需要浏览器与Python工具使用的真实任务上进行训练强化学习优化5.2.2 合理推断的部分有公开线索无明确官方披露推断内容推断依据推断结论多Agent拓扑OpenAI的Deep Research cookbook明确演示了single-agent和multi-agent两种research pipeline且通用Agents文档将多Agent分为manager pattern与decentralized handoff pattern多Agent是其支持的工程实现方式之一但无法确认ChatGPT产品内部一定恒为多Agent层级架构反思能力官方明确提到会用multi-step reasoning来compare and validate findings暴露reasoning summary与中间步骤具备回查、比较、校验与修正能力但无法确认内部存在命名明确的Reflection node或Critic agent5.2.3 尚未公开的部分无任何官方文档支撑需注明边界未公开内容边界说明内部拓扑细节ChatGPT产品内部是否固定采用多Agent架构官方未完整公开模块命名内部是否存在显式的Reflection nodeCritic agent等模块官方未公开记忆实现产品级长期记忆与状态持久化的具体技术实现方式官方未公开仅明确具备stateful/context-managed能力强化学习细节是否采用端到端多Agent强化学习调优官方未公开仅明确面向真实任务与工具使用的强化学习5.3 从OpenAI Deep Research看三类架构的组合应用5.3.1 架构组合模式┌─────────────────────────────────────────────────────────────────────────────┐ │ OpenAI Deep Research 架构组合模式 │ ├─────────────────────────────────────────────────────────────────────────────┤ │ │ │ ┌─────────────────────────────────────────────────────────────────────┐ │ │ │ 外层HITL Workflow壳层 │ │ │ │ • 用户可审阅计划、修改计划、限定可用来源 │ │ │ │ • 支持查看进度、随时打断、重定向任务 │ │ │ │ • 明显的人机在环特征 │ │ │ └─────────────────────────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────────────────────────────────────────────────────────┐ │ │ │ 核心层Autonomy-First Agent │ │ │ │ ┌───────────────────────────────────────────────────────────────┐ │ │ │ │ │ Plan-then-Execute模式 │ │ │ │ │ │ • 先生成结构化研究计划 │ │ │ │ │ │ • 用户可修改计划 │ │ │ │ │ │ • 按计划执行研究任务 │ │ │ │ │ └───────────────────────────────────────────────────────────────┘ │ │ │ │ │ │ │ │ │ ▼ │ │ │ │ ┌───────────────────────────────────────────────────────────────┐ │ │ │ │ │ ReAct循环工具调用闭环 │ │ │ │ │ │ • 自主分解子问题 │ │ │ │ │ │ • 调用web search、code interpreter、MCP/file search │ │ │ │ │ │ • 形成工具调用闭环 │ │ │ │ │ └───────────────────────────────────────────────────────────────┘ │ │ │ │ │ │ │ │ │ ▼ │ │ │ │ ┌───────────────────────────────────────────────────────────────┐ │ │ │ │ │ Reflection/Evaluator-Optimizer校验修正 │ │ │ │ │ │ • multi-step reasoning来compare and validate findings │ │ │ │ │ │ • 暴露reasoning summary与中间步骤 │ │ │ │ │ │ • 具备回查、比较、校验与修正能力 │ │ │ │ │ └───────────────────────────────────────────────────────────────┘ │ │ │ └─────────────────────────────────────────────────────────────────────┘ │ │ │ └─────────────────────────────────────────────────────────────────────────────┘5.3.2 与三类业务架构的映射关系OpenAI Deep Research体现了三类业务架构可正交组合的特点层级OpenAI Deep Research实现对应架构类型第一层交互与控制权外层HITL Workflow壳层用户可审阅计划、修改计划、限定可用来源、查看进度、随时打断、重定向任务人机在环Workflow类外层控制第二层编排方式核心层采用Plan-then-Execute ReAct循环具备动态推理循环能力自主规划类Agent核心执行第三层能力与治理工具调用web search、code interpreter、MCP/file search、记忆stateful/context-managed、反思multi-step reasoning校验、观测暴露reasoning summary与中间步骤横切能力组合关键洞察OpenAI Deep Research不能粗暴归为纯自主规划类Agent而是自主规划核心 人机在环控制的混合形态。5.4 从OpenAI Deep Research学习架构设计原则5.4.1 渐进复杂度原则OpenAI Deep Research的设计体现了先用足够简单的系统只有在复杂度能带来明确收益时再升级到更agentic的方案的核心原则复杂度层级适用场景OpenAI Deep Research体现单Agent/单调用简单查询、基础咨询基础ChatGPT对话Workflow系统强约束、强审计、多轮交互Deep Research外层HITL Workflow多Agent协作超复杂、多领域融合任务Deep Research核心层推断5.4.2 人机在环的价值OpenAI Deep Research在产品层明确加入人机在环控制这给我们重要启示可控性优先即使核心是自主规划Agent也要保留人工介入点透明度关键暴露reasoning summary与中间步骤让用户理解AI决策过程灵活性重要支持用户修改计划、限定可用来源、随时打断、重定向任务5.4.3 组合而非例外OpenAI Deep Research的设计证明了组合不是例外而是常态Plan-then-Execute ReAct循环自主规划核心 人机在环控制工具调用 记忆 反思 观测5.5 精简表述OpenAI Deep Research ≈ agentic deep-research model 规划与分解 工具调用闭环 来源比较/校验 引用化报告输出在ChatGPT产品层又包了一层可审阅计划、可中断的用户控制流程。它的工程实现可以是单Agent也可以扩展成多Agent流水线但官方并未完整公开ChatGPT内部的唯一拓扑。六、选型原则与演进路线6.1 核心选型原则渐进复杂度原则先用足够简单的系统只有在复杂度确实带来收益时再升级到更 agentic 的方案。6.2 决策树┌─────────────────────────────────────────────────────────────────────────────┐ │ Agent架构选型决策树 │ ├─────────────────────────────────────────────────────────────────────────────┤ │ │ │ 开始明确业务需求 │ │ │ │ │ ▼ │ │ 是否需要强合规、强审计 │ │ │ │ │ ├── 是 ──→ 是否需要多轮人机交互 │ │ │ │ │ │ │ ├── 是 ──→ 人机在环Workflow系统 │ │ │ │ 审批流程、企业级客服 │ │ │ │ │ │ │ └── 否 ──→ 考虑其他方案 │ │ │ │ │ └── 否 ──→ 任务复杂度如何 │ │ │ │ │ ├── 复杂长周期 ──→ 自主规划类Agent │ │ │ 会议调研、多文档汇总、复杂信息整理 │ │ │ │ │ └── 简单单次 ──→ 语义路由/工具助手 │ │ 简单查询、基础咨询、一次性检索 │ │ │ └─────────────────────────────────────────────────────────────────────────────┘6.3 演进路线┌─────────────────────────────────────────────────────────────────────────────┐ │ Agent架构演进路线 │ ├─────────────────────────────────────────────────────────────────────────────┤ │ │ │ 阶段1单Agent/单调用 │ │ ┌─────────────────────────────────────────────────────────────────────┐ │ │ │ 工具调用 简单推理 │ │ │ │ 适用简单查询、基础咨询、一次性检索 │ │ │ └─────────────────────────────────────────────────────────────────────┘ │ │ ↓ │ │ 阶段2Workflow系统 │ │ ┌─────────────────────────────────────────────────────────────────────┐ │ │ │ 显式状态图 人机在环 可审计可追溯 │ │ │ │ 适用审批流程、企业级客服、长周期业务跟进 │ │ │ └─────────────────────────────────────────────────────────────────────┘ │ │ ↓ │ │ 阶段3多Agent协作仅在复杂度确实带来收益时 │ │ ┌─────────────────────────────────────────────────────────────────────┐ │ │ │ Orchestrator-Workers Hierarchical 复杂编排 │ │ │ │ 适用超复杂、多领域融合任务 │ │ │ └─────────────────────────────────────────────────────────────────────┘ │ │ │ └─────────────────────────────────────────────────────────────────────────────┘七、开放问题与边界7.1 关于OpenAI Deep Research的边界公开资料更强调的是能力、接口、控制方式与输出形态而不是内部唯一拓扑。因此最终文档最稳妥的写法不是我断定它内部就是某种单一架构而是根据官方公开能力与工程范式它最接近哪类架构、由哪些模式组合而成、哪些部分是已确认事实、哪些只是高概率推断。这样既严谨也最适合企业内部评审、方案汇报和对外讲解。八、最终核心原则术语严谨严格区分workflow与agent不混淆编排模式、横切能力、拓扑结构的抽象层表述稳妥避免绝对化判断对未公开信息明确区分推断与事实主动注明研究边界落地导向架构设计与分类均贴合企业工程实践优先简单可用再考虑复杂升级避免过度设计逻辑清晰按控制权—编排方式—能力构件分层让三类业务架构、模式库、落地方案的逻辑闭环无矛盾点组合思维大多数真实系统都会混合多种模式组合不是例外而是常态参考OpenAI Deep Research总结核心要点分层思维把业务分类“编排模式”能力构件三层拆开写避免混淆不同抽象层术语对齐workflow与agent是两个不同概念前者强调可控性后者强调自主性渐进复杂度先用足够简单的系统只有在复杂度确实带来收益时再升级到更agentic的方案严谨表述区分官方确认“合理推断”尚未公开三层避免把推断写成事实组合原则参考OpenAI Deep Research的设计大多数真实系统都会混合多种模式组合不是例外而是常态企业级AI应用架构定位企业级AI应用是以显式状态图为核心的人机在环工作流系统内部嵌入局部agentic子图对当前强约束、强审计、多轮交互场景更适配。OpenAI Deep Research架构启示OpenAI Deep Research的核心研究引擎更接近自主规划类Agent但在交互壳层又明显带有人机在环workflow的特征体现了自主规划核心 人机在环控制的混合形态这为我们的架构设计提供了重要参考。