上周三下午我朋友小杨 —— 一个后端工程师打开 Cursor 输入了一行指令 「帮我把用户权限模块重构了改成 RBAC 模型。」然后他转身去茶水间接了杯咖啡。23 分钟后他回来的时候整个人愣住了。屏幕上7 个 AI Agent 已经干完了活有人重写了数据模型有人写完了单元测试有人改好了 API 接口中间有个 Agent 干到一半发现走不通直接放弃了任务另一个 Agent 看到空出来的活直接接过去继续干最后还有个 Planner Agent把所有人的成果审了一遍挑了最优的版本合并CI 过了PR 都建好了。小杨放下咖啡杯突然反应过来 这不就是我们团队每周干的事吗需求下来、拆任务、大家抢活干、干不了就换人、多个人做不同方案比稿、最后评审合并…… 流程一模一样。但没人教过 AI 这么做啊带着这个疑问我翻完了前段时间泄露的 Claude Code 那 50 万行源码又对比了 Anthropic、Cursor、OpenAI 三家的 AI 编程实践。结果我发现了一件细思极恐的事 这些 AI 工程师根本不是在写代码。 他们在重建一个微型的人类社会。 而那些我们花了 3000 年才摸透的文明规则AI 用 3 年就自己重新推出来了。1. 从「领导派活」到「自己抢单」AI 先学会了市场经济你有没有过这种经历 公司搞项目领导把任务一个个派给你「小王你做这个小李你做那个」。 结果小王说这个我不擅长啊小李说我手头活已经满了最后整个项目卡得要死。后来公司改了搞了个任务池活都放上去谁觉得自己能做、想做自己领。 结果效率一下就上去了。你猜怎么着AI 也学会了这一套。在 Claude Code 的源码里根本没有一个「中央调度器」来给 AI 派活。 系统会把所有前置条件做完的任务都丢到一个「Ready Pool」里。 然后空闲的 AI 自己去扫这个池子评估自己能不能干能干就自己领走。 干到一半发现搞不定直接放弃把任务放回池子里别人来接。这就是最典型的去中心化啊。以前我们总觉得中央调度最「可控」我给每个人安排好肯定效率最高。 但规模一大调度器自己就成了瓶颈 —— 你怎么可能比干活的人更清楚他能不能干这个活就像 250 年前亚当斯密说的「看不见的手」市场根本不需要中央指挥资源自己就会流到最该去的地方。 没想到 250 年后一群写代码的工程师用 TypeScript 把这个道理又验证了一遍。2. 从「口头约定」到「白纸黑字」AI 也需要签合同你装修过房子吗 一开始装修师傅跟你说「放心吧兄弟我懂两个月给你装好保证没问题。」 你信了。 结果干到一半他说「哦你要做防水啊那得加钱。」 最后验收的时候你说这墙不平啊他说「我觉得挺平的啊你要求太高了。」后来你学乖了开工前先签合同工期 60 天超一天罚多少钱验收标准水电要通、墙面平整度不超 2mm哪些地方不能改比如承重墙你绝对不能动干到 10 天我们碰一次头不对就及时改这下再也不扯皮了。巧了AI 干活前也要签这么个合同。Anthropic 给 AI 设计了个「Sprint Contract」干活前先把话说清楚合同条款具体内容输入给你 UserService 的源码还有需求文档别的你不用管输出你要给我改好的代码还有新的测试用例验收标准测试必须全过TypeCheck 不能有错误时间约束最多干 10 分钟到点我们就复盘范围边界你只能改这个模块AuthService 和数据库表你碰都不能碰你看这不就是装修合同吗为什么要搞这个 因为 AI 跟人一样干着干着就会跑偏。 你让他改权限模块他干着干着觉得哦这个 AuthService 也能优化一下顺手给你改了最后把你整个系统搞崩了。 而且时间越长他跑偏得越厉害 —— 就像你装修一开始说装个简约风干着干着就加了这加了那最后装成了欧式豪华风预算超了一倍。所以这个 10 分钟的小周期就是给 AI 踩踩刹车偏了就及时拉回来。 就像我们装修每 10 天验收一次不对就改总比最后装完了再拆了重来强。3. 「好篱笆造就好邻居」AI 也懂合租的边界你跟人合租过吗 刚合租的时候大家东西都放一起你的洗发水我用了我的零食你吃了今天你用了我的洗面奶明天我动了你的键盘天天吵架。 后来你们划了边界各自的房间没经过同意不能进各自的东西放自己桌子上别乱堆公共区域公共区域的东西用完了归位这下好了大家各干各的互不干扰反而关系更好了。西方有句谚语「Good fences make good neighbors.」 好篱笆才能造就好邻居。没想到AI 也懂这个道理。Claude Code 给每个 AI都搞了双重隔离物理隔离每个 AI 都有自己独立的工作目录就像合租的各自房间。你改你的文件我改我的咱俩谁也碰不到谁根本不会有文件冲突。认知隔离每个 AI 只拿到自己干活需要的那点信息就 15K Token多了不给。你改数据模型的就不用知道 API 层的细节省得信息太多把你搞晕了。你别觉得这是限制 AI这是在帮他聚焦。 就跟人一样你同时干十件事最后一件都干不好。你只干一件事反而效率高。而且越厉害的 AI越需要这个边界。 因为 AI 调用一次老贵了他的注意力就那么多你给他塞一堆没用的信息他反而看不到重点钱也白花了。就像合租你要是没边界两个人天天互相干扰最后谁都没法好好工作。有了边界大家反而能各自专注效率更高。4. 从汉谟拉比法典到 AI 也需要规矩你家有家规吗 我家就有全家的规矩晚上 11 点必须关灯用完厨房要收拾干净我房间的规矩看完的书要放回书架衣服不能乱扔椅子上厨房的规矩用完的锅要马上洗食材要分类放冰箱有了这些规矩我们家从来不用为了「谁用完碗不洗」「谁又把垃圾忘了倒」吵架。 因为规矩在那大家照着做就行不用每次都商量。3800 年前有个叫汉谟拉比的国王把当时的规矩都刻在了石碑上。 那是人类第一部成文法典。 从那以后大家不用再靠口耳相传谁做错了看石碑就行。没想到 3800 年后AI 也有了自己的「法典」——。Claude Code 的规则也是分层的全局的规则所有项目都要遵守的比如代码要加注释变量要用小驼峰项目的规则这个项目特有的比如我们这个项目用 Python3.10不能用新特性目录的规则这个文件夹特有的比如支付模块的接口单位是分不是元你看这不就是我家的家规吗为什么要搞这个 因为 AI 的脑子也有限啊。 他不可能每次遇到「这个接口单位是啥」都去问你一遍。 也不可能每次遇到「这个文件能不能改」都从头推理一遍。有了规则他直接查表就行。 就像你过马路不用每次都算「车开过来我能不能过去」你只要看红绿灯就行。 规则就是把那些重复的决策提前算好省得每次都费脑子。汉谟拉比当年刻石碑就是干这个的。 把大家的经验变成所有人都能看、都能遵守的规矩。 现在我们写干的是一模一样的事。5. 禁止私下聊天AI 团队也怕谣言你有没有过这种经历 公司做项目大家建了个大群所有人都在里面聊天。 结果 A 说「我觉得这个接口可能要改」B 看到了就顺手把自己的代码改了适配这个新接口。 结果 A 最后只是随口一说根本没改B 白忙活了半天。 更糟的是一个错误的消息半天就能传遍整个团队所有人都被带偏了。这就是「谣言」啊。 人多了私下聊天多了谣言就止不住了。没想到AI 团队早就把这个问题解决了 —— 他们直接禁止 AI 私下聊天。在 Cursor 的团队里所有的 AI Worker互相之间不能直接说话。 他们只能跟一个人说 —— 就是那个 Planner。 Worker 干完活把结果发给 PlannerPlanner 汇总完再告诉大家。你别觉得这很反人性这太聪明了。 你想7 个人的团队如果大家都能互相聊天那就是 7*621 条通信链路消息满天飞。 但如果都只跟 Planner 说那就只有 7 条链路干净利落。而且更重要的是谣言传不开了。 一个 Worker 搞错了他只会把错误的消息发给 PlannerPlanner 一看不对直接就给拦下来了不会传给其他人。 要是大家都能互相聊那一个错误分分钟所有人都知道了整个团队都跑偏了。就像我们做项目最怕的就是大家私下乱传消息。 你有啥问题直接跟项目经理说别私下跟别人瞎猜不然最后越传越歪。 Cursor 的工程师把这个道理直接写进代码里了。6. 必须有「反对派」AI 也懂兼听则明你有没有过这种时候 你写了个方案自己看了八百遍觉得完美一点问题都没有。 结果给同事一看人家一眼就看出了好几个 bug。 为啥 因为你自己写的东西你总会觉得自己是对的你看不到自己的问题。所以我们才有了 Code Review才有了议会里的反对党。 就是要找个人站在你的对立面帮你挑错。没想到AI 也把这个玩明白了。不管是 Anthropic、Cursor 还是 OpenAI他们都搞了同一个设计 干活的 AI和审活的 AI必须是两个。AnthropicGenerator 负责写代码Evaluator 负责审你不能自己审自己的CursorWorker 负责干活最后 Planner 统一审核干活的不能自己决定能不能过OpenAIAI 干完活必须拿出证据证明自己干对了不然不能过为什么要这样 因为 AI 跟人一样有个毛病「自洽偏差」。 就是我写的代码我总会觉得我是对的我会自己给自己找补说你看我这逻辑没问题啊。 但换个 AI站在旁观者的角度一下就看出问题了。就像我们常说的「没有反对派的议会一定会犯错」。 一个系统能不能靠谱不是看里面的人有多聪明而是看有没有不同的声音有没有人帮你挑错。 你看飞机有正副驾驶互相查核电站有独立的安全审查金融有前中后台分离都是这个道理。现在 AI 也学会了干活的和审活的必须分开。为什么 3000 年和 3 年最后走到了一起看到这你可能会说这是不是巧合啊是不是工程师们照着人类社会抄的还真不是。 工程师们只是在解决 AI 协作的技术问题结果最优解刚好和人类的制度一模一样。为什么 因为不管是碳基的人还是硅基的 AI只要凑在一起干活就一定会面对四个一模一样的问题就像一群朋友一起做蛋糕大家都是独立的你有你的想法我有我的我们可能会干矛盾的事资源是有限的面粉就那么多鸡蛋就那么几个我们要抢信息不对称你只知道你做奶油的事我不知道你奶油放了多少糖我们都只知道自己的部分你的行动会影响我你把蛋糕胚烤糊了我奶油做的再好也没用你看这四个问题跟人还是 AI根本没关系。 只要你有多个独立的个体要一起干活共享资源就一定会遇到这四个问题。那怎么解决 你就得搞出让大家自己抢活的市场解决资源分配的问题签合同解决大家约定不清的问题划边界解决互相干扰的问题定规矩解决大家决策成本的问题管通信解决谣言的问题搞审查解决大家看不到自己错的问题这些不是人类「发明」的啊。 这是只要有多个智能体要协作就一定会长出来的东西。 就像引力牛顿没发明引力他只是发现了它。 汉谟拉比也没发明法律他只是发现了要解决协作的问题就得有这些规矩。现在 AI 用 3 年的时间把人类 3000 年的路又走了一遍。 不是 AI 聪明是这些规则本来就是宇宙的规律。三大巨头的「建国方略」原来他们在比制度现在你明白了吧这些 AI 公司根本不是在比谁的模型更聪明。 他们在比谁的「制度」更好。Anthropic、Cursor、OpenAI三家搞出了三种完全不同的治理模式刚好对应了人类的三种制度Anthropic 的「共和国」三权分立互相制衡如果一个 AI 要干 3 小时的长任务怎么防止他跑偏 Anthropic 的办法是搞三个角色Planner定计划保证我们做的事是对的Generator干活负责把事做完Evaluator审查保证干出来的东西是对的三个角色互相查你错了我给你指出来我错了你给我指出来。 就像三权分立谁也不能说了算互相制衡。 这就是小团队的玩法人少大家互相盯着保证不出错。Cursor 的「联邦制」各自干活最后汇总如果 7 个 AI 要同时改一个代码库怎么不让他们打架 Cursor 的办法是搞联邦制 每个 AI 都有自己的副本各自干各自的互相之间谁也不认识谁谁也别干扰谁。 最后干完了大家把成果交上来统一合并。就像美国的联邦制每个州自己管自己的只要最后遵守联邦的规则就行。 这就是大团队的玩法人多大家各自干自己的不用互相协调最后汇总就行省得协调成本太高。OpenAI 的「法治社会」靠规则不靠信任如果我有 100 个 AI我一个人管不过来怎么办 OpenAI 的办法是搞法治 我不管你是谁你干完活必须拿出证据证明你干对了。 测试过了lint 过了有没有改不该改的地方 都没问题那你就自动过我不用看。 有问题那才来找我。这样我一个人就能管 100 个 AI因为大部分事规则都帮我搞定了。 这就是大社会的玩法人太多了管不过来就靠规则靠法治不用人盯人。你看三家公司以为自己在做技术竞争结果其实是在做制度竞争。 就像几百年前人类也在试到底什么样的制度最适合管一群人。 现在他们在试什么样的制度最适合管一群 AI。你的新工作不是写代码是给 AI「立法」看到这你可能会问这跟我有啥关系关系大了。 以前我们是干活的人。 现在我们要变成「立法者」了。你以为你在编辑.cursorrules 不对你在给 AI 定法律。 你以为你在写 不对你在编纂法典。 你以为你在设计 CI 流程 不对你在设立司法审查。最好的市长不是自己去修路的那个。 是设计好规则让修路队自己知道怎么把路修好的那个。 最好的工程师也不是自己写最多代码的那个。 是设计好规则让 10 个 AI 自己把代码写好的那个。我给你算笔账 以前你一天能写 500 行代码。 现在你花一天写一套好的规则让 5 个 AI每个一天写 500 行。 你一天的产出就变成了 2500 行。 这不是 5 倍提效这是从「工人」到「老板」的跃迁。就像工业革命的时候最值钱的不是最会手工干活的工人是能设计流水线的工程师。 现在 AI 时代最值钱的也不是最会写代码的程序员是能给 AI 定规则的「治理工程师」。我们正在见证什么你有没有想过我们现在正在经历什么我们往 AI 的代码里看看到了 while 循环看到了 Token看到了 Git。 但退后一步你会看到一个去中心化的劳动力市场一套签合同的执行规则一个个清晰的产权边界一套分层的法律体系一个不会传谣言的通信网络一个互相审查的制衡机制一个完整的社会在一堆 TypeScript 代码里悄悄长出来了。人类花了 3000 年才演化出这些东西。 AI 花了 3 年就自己推出来了。 不是因为 AI 比人聪明是因为这些东西本来就是协作的最优解。 不管你是碳基还是硅基只要你要协作最后就会长成这个样子。就像开头那个工程师他喝了杯咖啡的功夫就见证了一个新文明的诞生。 他手里的那个就是这个新文明的汉谟拉比法典。3800 年前汉谟拉比把法律刻在石碑上。 今天我们把规则写在.md 文件里。 历史只是在换一种方式重演而已。 最后想问问大家 你用过 AI 编程工具吗你有没有发现AI 其实已经在偷偷「模仿」我们人类的工作方式了你觉得未来你的工作会变成「给 AI 立法」吗 评论区聊聊你的看法