零人工手写，5个月拼出百万行代码！深度拆解 OpenAI 颠覆性的 “Harness Engineering” 软件开发新范式

张

张建站

2026/5/16 13:05:06

10分钟阅读

零人工手写，5个月拼出百万行代码！深度拆解 OpenAI 颠覆性的 “Harness Engineering” 软件开发新范式

发布日期2026-02-11标签#OpenAI #HarnessEngineering #Codex #AI_Agent #软件工程 #架构设计一、引言Agents arent hard; the Harness is hard.Agent 不难难的是 Harness。这是 OpenAI 技术团队近期公开的一项震撼业界的实验报告。在过去 5 个月里OpenAI 的一个研发小组在零人工手写代码的限制下完全依靠 Codex 智能体构建并交付了一款拥有百万行代码的复杂软件产品包含应用逻辑、测试、CI 配置、可观测性及内部工具且该产品已投入内部 Beta 测试。在这场实验中人类工程师的角色发生了根本性转变他们不再亲自动手写代码而是转向了一门全新的学科——Harness Engineering驾驭工程。二、什么是 Harness Engineering在控制论哲学中Harness环境/鞍具指的是大模型之外的一切控制系统。OpenAI 提出了一个颠覆性的公式$$\text{Agent} \text{Model} \text{Harness}$$人类工程师的任务从“实现状态”转变为“声明期望状态”并为 AI 智能体设计一套具备明确约束与闭环反馈的运行系统Harness。Harness Engineering的核心架构可以分为以下四个核心层次架构层级核心组件控制论机制核心功能前馈控制层 (Guides)PRD 文档、架构说明书、代码规范Feedforward设定先验约束指导 Agent 在动手前“想清楚”下一步防止架构漂移。反馈控制层 (Sensors)自动化 Linter、单元测试、沙箱环境Feedback观察 Agent 执行后的状态通过错误日志引导其“自我修正Self-Correction”。执行运行时 (Runtime)Codex App Server (JSON-RPC)Execution提供双向通信、线程生命周期管理及工具如 GitHub CLI的沙箱执行。生命周期管理自动化清理与状态重置GC机制防止长周期任务中的 token 膨胀与上下文熵增。三、核心技术与工作流破局1. 人类掌舵智能体执行The Ralph Wiggum Loop在 OpenAI 的设计中人类与系统的交互几乎完全通过声明式的 Prompt 完成。工作流形成了一个强闭环人类声明意图工程师描述一个任务运行 Agent。本地与云端协同评审Codex 自动修改代码后在本地运行测试并调用 ghGitHub CLI工具自动打开 Pull Request。自我修正直至通过系统强制 Codex 在本地审查自己的修改并请求多维度的 Agent 联合评审反复迭代直到所有环境 Sensor 满意。2. 将“计划”视为第一类资产 (Plans as First-Class Artifacts)为了防止完全自主的智能体在高并发、长周期任务中迷失OpenAI 将“计划”做成了机器可读的、版本化管理的实体轻量级计划用于处理修复 Bug 等小范围变更。执行计划 (Execution Plans)对于复杂需求生成包含决策日志和进度追踪的复杂计划并直接 Check-in 到 Git 仓库中。这让 Agent 可以实现“渐进式披露”无需一开始就被海量上下文淹没。3. 内核级通信Codex App Server为了让这种高频的交互流在各种 UI 和 CLI 之间保持弹性OpenAI 构建了Codex App Server。它基于双向的 JSON-RPC 协议并抽象出了两个核心原语Item原子单元带有明确生命周期Started $\rightarrow$ Delta 流 $\rightarrow$ Completed的打字数据如代码 Diff、审批请求。Turn工作轮次由用户输入触发、到 Agent 产生最终输出结束的完整工作周期。四、行业启示工程师的明天在哪里OpenAI 的实验用数字证明了生产力的飞跃构建百万行代码系统仅消耗了传统人工编写约 1/10 的时间和注意力。当“写代码”的成本趋近于零软件工程的护城河将彻底重构。未来的核心竞争力不再是精通某种语言的语法而是架构定义能力如何 mechanically 约束代码库边界防止 AI 产生代码漂移与模式复制。控制系统设计如何编写高精度的自动化评估器Evals和反馈流让 AI 能在沙箱中快速自愈。五、总结与展望Harness Engineering并不是在消灭工程师而是在解放人类最稀缺的资源——时间和注意力。在智能体优先Agent-First的世界里卓越的工程师将成为系统航向的掌控者和反馈回路的设计师。这场百万行代码的无人驾驶实验仅仅是新时代的开端。互动话题面对 OpenAI 的“零手写百万行代码”案例你认为未来五年内初级程序员这个岗位会彻底消失还是演变成全新的“Harness 调试员”欢迎在评论区留下你的硬核观点如果你想更直观地理解如何通过环境约束和反馈闭环来驾驭复杂的 AI 工作流推荐观看 Harness Engineering 到底是什么概念、实战与争议深度解析。该视频用通俗易懂的语言一次性讲清了 OpenAI 和 Anthropic 在驾驭智能体方面的底层逻辑与前沿争议。参考链接https://edison-a-n.github.io/2026/03/14/harness-engineering-practical-guide/https://openai.com/zh-Hans-CN/index/harness-engineering/