Agent 会自己长出技能？聊聊 Hermes 的技能进化机制

张

张建站

2026/5/13 18:02:29

10分钟阅读

Agent 开发的几乎都绕不开一个念头智能体能不能越用越聪明具体来说能不能做到把做过的事自己沉淀下来用户下次不用再把同一套流程教一遍Hermes 对这个问题的处理没有往玄学上飘也没吹嘘自己在后台偷偷训练新模型。它做得很朴素也很工程化每当 Agent 在任务里摸索出一套可以复用的做法就通过skill_manage把这套做法写回本地技能文件。下次遇到类似任务再把它拿出来继续用、继续改。Hermes 的技能进化不是参数层面的学习更不是凭空长出什么新能力。它更像是把一次任务里跑通的经验整理成一份能随时查阅、修改、甚至回滚的操作手册。下面顺着这条链路拆开看一看。Hermes 里”自动创建技能”的真实路径1 自动创建技能本质是文件写回不是训练Hermes 所谓的自动生成技能本质上是一套工具调用流程而不是训练流程。Agent 并不会把一次任务丢给某个学习器然后在模型参数里“长”出新能力。它做的是1. 任务进行时提醒模型尽量使用和维护技能2. 任务结束后回头审视这次有没有值得复用的流程3. 如果有就调用skill_manage()创建新技能或者给旧技能打补丁4. 把结果写回本地技能目录让后面的会话可以直接复用。所以 Hermes 的“进化”准确来说是文件层面的经验写回。听起来当然没有“模型自我学习”那么高级但好处很实在它可控。它学到了什么你能打开文件直接看。它写到了哪里你能精确定位。它有没有写坏你可以审查、回滚、再改。下一次为什么做得更顺也都有迹可循。2 为什么能进化经验有地可写且支持打补丁很多 Agent 系统并不是发现不了经验而是发现之后没地方存储处理。这次调通了一套部署流程下次还得重新琢磨这次踩过一个环境坑下次换个会话又踩一遍。问题不是在于“有没有经验”如果用户没有主动把本次流程固化为Skills就等于是“经验有没有被系统接住”。Hermes 把这件事做成了一条明确的写回路径skill_manage()支持的操作包括create创建一个新技能 patch给已有技能打补丁 edit重写 SKILL.md write_file给技能增加附属文件 remove_file、delete删除内容最值得关注的是打补丁。Hermes 不鼓励 Agent 一上来就重写整份技能文档而是更偏向“补一小段”。这更接近真实的维护习惯任务里发现了一个新坑、一个命令差异、一个验证步骤就把它追加或修正到相应位置。这样做有几个实际好处token 消耗更小修改范围更窄更适合持续修补那些从真实任务里冒出来的细节。并且它的打补丁不是死板的字符串替换底层用了模糊匹配模型不需要精确记住原文里的每个空格只要上下文能对上就有机会把补丁打到正确位置。这就是它能**“边用边修”**的原因。3 自动创建不靠开关而是三层机制叠在一起Hermes 的技能进化不是靠某个神秘按钮触发的更像是三层提示和流程叠加出来的结果。1. 系统提示词持续提醒系统提示会反复提醒模型两件事复杂任务结束后考虑要不要保存成技能使用技能时如果发现过时、缺漏或错误及时打补丁。这会让模型不只盯着解决眼前问题也会被引导去思考“有什么值得留下”。2. 工具的 schema 告诉它“怎么保存”skill_manage的 schema description 里有详细的操作规范什么情况适合创建什么情况更适合打补丁什么样的技能才算质量过关创建和删除前最好确认用户意图。Hermes 不仅告诉模型“你可以保存经验”还告诉它“别乱写尽量这样写”。3. 后台复盘把“想一想”变成固定流程真正把这套机制推起来的是run_agent.py里的后台复盘。Hermes 会维护一个技能计数器当达到阈值主任务完成后会启动一个后台复盘代理。这个代理不直接跟用户聊天而是拿着当前会话快照加上复盘提示专门判断“有没有值得沉淀成技能的非平凡工作流”。有就创建或更新没有就安静退出。这就把“顺手记一笔”从模型自觉变成了系统级的固定动作。后台复盘如何在主任务完成后异步沉淀技能4 不是自治不“裸写”半自动背后的边界与安全如果给这套机制一个准确的描述就是提示驱动、阈值触发、后台复盘、文件写回。它不是完全自治主要有三个原因。首先是否值得保存仍然要靠模型判断不会每次任务都产出新技能。其次创建前确认用户意图更多是软约束存在于提示和工具描述层不是硬阻断。再者它不是一个无限膨胀的知识工厂重点是留下真正有复用价值的流程。更能体现工程成熟度的是它对写入环节的约束。只要允许 Agent 写文件真正要关心的就不是“能不能写”而是“写得稳不稳、边界够不够硬”。Hermes 在skill_manage()的真实写入阶段做了大量校验技能名称是否合法分类是否合法SKILL.mdfrontmatter 是否完整内容大小是否超限附属文件是否只写到允许的子目录路径有没有穿越风险。写入后还会经过skills_guard安全扫描不通过就回滚。尤其对 Agent 自己创建的技能策略并不宽松某些风险判定可能直接阻断。技能写回不是直接落盘而是带校验和回滚5 复盘时机后台一次会话重置前再兜底一次Hermes 没有在任务中途打断主流程而是在主任务给出最终回复后异步拉起一个轻量 Agent 做复盘。这个后台 Agent 复用当前模型和上下文快照却不污染主会话也不抢注意力。如果创建或更新了技能前台只给一个很短的摘要提示。好处很直接当前任务先完成经验沉淀不干扰主推理交付和复盘可以并行。除了这种后台复盘Hermes 还有另一道保险。当会话因为长时间不活跃或定时重置即将被清空系统会再启动一轮清场复盘用一个临时代理回顾整段对话看看有没有遗漏的记忆或技能值得保存。很多复杂任务当下未必能立刻意识到是一套可复用流程会话结束前再看一遍等于给经验沉淀加了一层兜底。因此技能进化实际上有两个出口主任务后的后台复盘和会话重置前的清场复盘。6 为什么好用工程化学习与可审计的闭环一次复杂任务结束后如果系统能把“什么时候该触发、先做什么后做什么、哪些命令有效、哪些坑已经踩过、最后怎么验证”这些信息留下来下一次类似任务到来时Agent 就不需要重新猜测可以直接沿着上次真实跑通过的流程往前走。重复劳动少了失败成本低了而且因为技能是文件人可以审查、补充、分发团队协作也更容易。所以我更愿意把 Hermes 的技能进化叫作“工程化学习”。它没有神秘感但非常能落地。归结成一句话Hermes 让经验以工程资产的形式留下来而不是散落在一次次对话里。你也可以说“Hermes 自己长出技能了”它长出的不是参数能力而是一份份能打开查看、能继续维护、能打补丁、也能被安全扫描的技能文件。这背后是一条非常清晰的闭环在任务中发现经验在任务后判断价值用工具写回用安全机制限制风险在未来会话中再次加载和修补。它没有”自治超级智能”那么夸张却很像真正能落地的软件工程——一个 Agent 变好用不是因为它声称自己会成长而是因为它知道经验应当放在哪里下一次又该怎么拿出来用。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

超省心！OpenClaw 中文汉化版部署实操教程

https://openclaw.ikidi.top/api/download/package/26?promoCodeIV5CDD48591D 一、OpenClaw（小龙虾）核心优势拆解 OpenClaw 成为增速较快的开源 AI 项目，核心在于解决了「技术门槛高、隐私不安全、功能不实用」三大痛点，小白也能…...

2026/5/13 18:02:16 阅读更多 →