【Agent Harness】AI连个前端Web页面都做不出来，凭什么让我信它能写后端？

张

张建站

2026/6/16 9:38:58

10分钟阅读

【Agent Harness】AI连个前端Web页面都做不出来，凭什么让我信它能写后端？

AI连个前端Web页面都做不出来凭什么让我信它能写后端AI连前端UI都做不精准——按钮颜色、圆角、间距反复出错暴露了它缺乏精确映射与自主校验能力的本质。后端开发看似“还行”实则错误更隐蔽、代价更大。本文从AI画不好UI这一现象切入揭示AI能力的真实边界并介绍如何通过工程化手段系统校验、自动纠错、经验沉淀弥补AI缺陷让AI从“可用”走向“可靠”。最近在群里看到一个吐槽笑死我了“让AI照着设计稿写个页面结果它给了一个蓝底黑字的按钮圆角还是方的。我截图圈出来让它改它说‘已修改’然后给了一个红底白字的按钮。”笑了之后我突然意识到一个很严肃的问题连UI这种“一眼就能看出对不对”的活都干不利索我们凭什么相信AI能自主完成那些“看不见摸不着”的后端开发、数据库设计、系统架构一、前端UI是AI能力的“照妖镜”前端开发有个特点结果立等可见。你给AI一张设计稿让它生成HTML/CSS效果好不好打开浏览器一眼就看出来了——按钮位置偏了5像素、颜色不对、字体错了根本不用技术背景是个人都能指出来。但恰恰是这个“一眼能看出来”的活目前的AI做得很差。你让它照着Axure导出的HTML复刻一个页面它能把布局搞乱、把间距吃掉、把颜色换成它觉得“更合理”的配色。你让它“改回去”它要么改得更离谱要么说“已修改”但其实什么都没动。为什么因为前端还原不是“生成代码”而是“精确映射”。AI擅长生成“看起来像”的东西但不擅长“一模一样”。它没有视觉校验能力没有像素级的精确度更不会主动对比自己的输出和原始设计稿之间的差异。前端是AI能力的“照妖镜”因为它把AI的缺陷暴露得明明白白幻觉、自以为是、缺乏精确校验、无法自主纠错。二、后端开发其实更惨只是你看不见很多人觉得“前端做不好没关系后端逻辑AI写得还行。”行个鬼。前端你还能一眼看出问题后端的问题是你根本看不见。AI帮你设计了一个数据库Schema少了一个关键索引等上线后QPS上来了才发现查询要5秒——这时候你已经加班一个月了。AI帮你写了个认证逻辑token有效期写死24小时结果有个业务需要7天上线后用户疯狂掉线——你又得连夜修。后端开发不是比前端更简单而是后端的错误更隐蔽、代价更大、发现更晚。AI在这里的毛病和前端一模一样它不会主动校验自己的输出是否符合需求文档不会检查是否有遗漏的边界条件更不会预测这个设计在未来业务扩展时会不会崩盘。它只是“生成了一段看起来合理的代码”然后等着你发现漏洞。前端画不好UI是AI能力不够的直接证据。你之所以觉得AI写后端“还行”只是因为后端的错误没那么容易被肉眼发现而已。三、从“完全信任AI”到“工程化弥补AI缺陷”所以结论很明确单凭AI自己的能力离“完全信任地自主完成任务”还差得远。不管是前端还是后端不管是UI还是数据库AI都需要一个“监工”——一个能帮它校验、纠错、回溯、沉淀经验的系统。这就是我为什么要做流马Gliding Horse——一个Agent Harness一个AI Agent的操作系统。流马不是让AI更聪明而是让AI更可靠。它是这么干的1. 系统调用门AI输出必须过“安检”每次AI要调用工具或写入数据流马会先做两层校验JSON Schema校验参数格式对不对数字签名验证这个Skill是不是被篡改过。AI想瞎写门都进不来。2. CA检查Agent专门给AI挑刺流马有一个专门的CACheck Agent不干别的就负责检查DA执行Agent的输出。前端代码写好了CA先对比设计稿和实际渲染截图发现颜色不对、间距偏差直接打回触发重新生成。后端Schema设计了CA自动跑一遍查询性能测试发现缺索引立刻标记。3. 知识图谱记忆犯过的错不再犯每次AI犯错CA的检查结果会被写入知识图谱。下次有类似任务SASupervisor Agent会提前注入历史经验“上次类似的设计稿AI把圆角写成了直角这次重点关注按钮样式。”这就是L0长期记忆的真正价值——不是存聊天记录而是存“教训”。4. 动态PDCA死循环改到合格为止DA生成代码 → CA检查 → 不合格 → 打回DA重做 → CA再查。这个循环可以自动跑好几次直到CA说“过了”为止。人不用盯着流马自己就能把AI的输出打磨到可用状态。四、所以AI到底什么时候能自己画UI我也不知道。但我确定的是与其等模型厂商把AI训练到“一遍过”不如现在就用工程手段把AI的输出质量管起来。流马的思路不是“相信AI”而是“不信任AI所以给它套了个完整的质量管控体系”。这套体系里AI只是干活的校验、回溯、纠错、经验沉淀全是系统在兜底。这就是Agent Harness的价值不是让马跑得更快而是给马套上缰绳、配上骑手、装好导航。AI连UI都画不好的今天谈“自主完成任务”还为时过早。但如果你给AI配上一个可靠的运行环境——能校验它、纠正它、从它的错误中学习——那它离“可用”就近了一大步。五、流马开源欢迎来玩流马Gliding Horse的所有核心代码都在GitHub上开源用Rust写成图数据库用Oxigraph记忆系统借鉴了CPU缓存架构。文档还在补但架构和理念已经能打。如果你也对“给AI套缰绳”这件事感兴趣或者觉得动态PDCA、知识图谱校验、系统调用门这些概念有点意思欢迎来star、提issue、一起搞。最后说句心里话别被“AI将取代程序员”这种话忽悠了。AI现在还处于“连个按钮都画不准”的阶段。真正能让AI可靠落地的不是更强的模型而是更强的工程。流马想做后者。GitHub地址https://github.com/doiito/gliding_horse

智能化运维落地，ATU 系统一键顺控优化配电管控

智能开关柜需实时监测开关柜全电能参数监测与测量如：电流、电压、功率、频率、相角，实时记录电能参数告警事件，开关柜环境监测与控制如：环境温度、环境湿度、断路器动态指示、人体感应、语音防误、高压带电显示等，柜内…...

2026/6/16 9:38:06 阅读更多 →

一体化应急指挥｜园区矿山可视化调度解决方案

在工业园区、矿山、能源基地、化工厂区、物流基地和大型生产现场，应急通信系统承担的职责已经不再局限于基础通话和通知广播。真正发生突发事件时，调度中心需要在较短时间内完成事件接入、位置确认、现场核查、人员调度、分区广播、跨部门协同和处置记录…...

2026/6/16 9:37:51 阅读更多 →

岩石爆破优化实战：从参数设计到效果评估的闭环管理

1. 项目概述：从“炸得开”到“炸得好”的跨越干了十几年爆破工程，从露天矿山到城市地铁隧道，我最大的感触就是：爆破这活儿，早就不只是“点个炮，听个响”那么简单了。客户和监管方现在要的，是“…...

2026/6/16 9:31:08 阅读更多 →

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…...

2026/6/15 4:19:08 阅读更多 →

DPDK高性能交换机深度实践：一次RSS失衡导致单队列拥塞的现网故障分析

一、故障背景某运营商IDC部署了一套基于DPDK的软件交换机集群。主要功能：二层交换三层路由 VXLAN Gateway ACL访问控制流量镜像硬件配置：项目配置 CPU Intel Xeon Gold 6338 网卡 Intel X710 210G DPDK 22.11 PMD Core 16 RX Queue 16 TX Queue 16 NUMA 双路系统稳…...

2026/6/16 1:03:47 阅读更多 →

UndertaleModTool揭秘：解锁GameMaker游戏修改的终极奥秘

UndertaleModTool揭秘：解锁GameMaker游戏修改的终极奥秘【免费下载链接】UndertaleModTool The most complete tool for modding, decompiling and unpacking Undertale (and other GameMaker games!) 项目地址: https://gitcode.com/gh_mirrors/un/UndertaleMod…...

2026/6/16 1:04:25 阅读更多 →

Cursor AI终极解锁方案：简单4步免费使用Pro功能的完整指南

Cursor AI终极解锁方案：简单4步免费使用Pro功能的完整指南【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached your…...

2026/6/16 1:04:14 阅读更多 →