欢迎来到卷 4知识与数据。在前面的章节里我们赋予了 AI 思考的框架Prompt和行动的手脚MCP/Skills。但如果现在你问 AI“咱们公司昨天发布的新产品退款政策是什么”它一定会胡编乱造。为什么因为它脑子里只有它被“训练”时通常是一年甚至更久以前互联网上的公开数据它完全不知道你们公司的内部机密和最新动态。为了给 AI 补充知识行业里有三种主流方法直接塞进 Prompt上下文注入、微调Fine-tuning和RAG检索增强生成。这三者到底有什么区别新手最容易犯的错就是一上来就喊着要“微调”一个模型。本篇我们就用大白话彻底讲透它们的适用场景帮你省下几十万的冤枉钱。1. 核心概念比喻考试开卷 vs 闭卷假设 AI 是一个准备参加考试的高中生现在他要考你们公司的“内部业务知识”。方法一直接 Prompt上下文注入—— 考前死记硬背做法你把公司的业务手册复制粘贴到聊天框Prompt里对他说“根据下面这段长长的内容回答我的问题……”优点最简单零成本立马见效。现在的模型上下文窗口极大能塞进几十本书基本够用。缺点每次问问题都要把这几十本书重新塞进去一遍Token 成本爆炸回答变慢。而且如果手册更新了你得手动重新复制粘贴。方法二微调Fine-tuning—— 闭卷考试重塑大脑做法你花几十万把公司的所有资料喂给大模型让它在显卡阵列上“重新学习”一个月。训练出一个专属于你们公司的“定制版模型”。考试时不带任何资料闭卷全凭脑子里的记忆回答。优点它不仅记住了知识还学会了你们公司说话的“语气和格式”比如客服专用的温柔话术。致命弱点极难更新时效性差如果退款政策明天变了你难道要再花几十万重新训练一次模型幻觉严重不可追溯当它回答问题时它是凭“直觉”说出来的。如果你问它“你这句退款规则是哪一页规定的”它根本答不上来甚至会自己编造一个页码。方法三RAG检索增强生成—— 开卷考试带图书馆进考场全称Retrieval-Augmented Generation。做法你把公司资料全部放进一个“外挂数据库”里也就是图书馆。当考官提问时AI 并不是凭记忆回答而是先去数据库里**检索Retrieval**出相关的几页资料。把这几页资料带入上下文Augmented。最后根据这几页资料总结**生成Generation**答案。优点永不胡编可追溯AI 可以明确告诉你“我的答案来自《退款手册》第 3 页第 2 行”。这在企业级应用中是最核心的要求。秒级更新时效性极强如果退款政策变了你只需要在数据库里把旧文件替换掉。下一秒 AI 就能用最新的政策回答问题完全不需要重新训练。权限控制你可以规定普通员工提问时AI 只能检索“公开文档库”老板提问时AI 还能检索“财务数据库”。微调模型做不到这一点因为它把所有秘密都记在脑子里了。2. 决策的核心指标你需要的是“知识”还是“技能”很多老板一拍脑袋“我们要微调一个懂我们业务的模型”这通常是把“记忆事实”和“学习风格”搞混了。如果你需要 AI 记住具体的事实、数字、政策知识➡️必须用 RAG。大模型是用来推理的不是用来当数据库的。把事实硬塞进模型参数里就像用跑车去拉板砖一样低效且昂贵。如果你需要 AI 改变说话的方式、输出特定的代码格式、或者学习某种极其垂直的诊断逻辑技能/风格➡️才需要微调。微调是用来改变行为模式的。最佳实践业界共识RAG 负责事实微调负责风格。在 95% 的企业落地场景中你根本不需要微调一个“强大的通用大模型 RAG 知识库”就能解决所有问题。3. 本篇产出知识补充选型决策树项目版当你拿到一个“需要 AI 懂特定知识”的需求时请严格按照以下决策树来选择技术方案小于 10 万字几十万字到海量很少更新如经典算法原理经常更新 如每日新闻/价格表要求极高且 Prompt 无法搞定一般/通过 Prompt 约束即可需求: 需要 AI 了解特定知识知识量有多大?知识更新频繁吗?直接走 RAG直接写进 System Prompt 里对 AI 的语气/特定输出格式要求高吗?微调 Fine-tuning RAG仅使用 RAG 或直接 Prompt决策补充说明优先尝试“直接 Prompt”如果你的文档只有十几页千万别去搞什么 RAG 或微调。现在 Claude 3.5 Sonnet 或 GPT-4o 的上下文窗口极大把文档全塞进提示词不仅成本低而且理解最准确因为不需要切分片段。知识量极大或经常变动时上 RAG当你的文档有成百上千篇或者每天都在更新时RAG 是唯一可行的工业级方案。把微调作为最后手段除非你是要做垂直领域的“特定文风模仿比如模仿林黛玉写诗”或者“让小模型学会复杂的特定 JSON 输出格式以降低推理成本”否则不要轻易碰微调。4. 总结与复盘**微调Fine-tuning**是给 AI 做“脑部手术”改变它的性格和技能习惯但很难更新记忆且容易产生幻觉。直接 Prompt是“考前发小抄”简单粗暴适合小量、短期的知识补充。RAG检索增强生成是给 AI 配备了一个“可以随时查阅的外部图书馆”。它保证了知识的实时更新、可追溯性和权限隔离是目前 AI 落地企业业务最核心的架构。下一步路线提示既然 RAG 是企业接入专属知识的最佳方案那这个“外部图书馆”到底是怎么建起来的公司里有 Word、PDF、网页、甚至是代码库它们怎么才能变成 AI 能听懂的格式下一篇我们将进入实操前奏《知识采集文档、网页、代码库、数据库怎么进知识库》。