一、RAG 整体完整流程必考文档入库原始文档 → 文本预处理 → 智能分块 → Embedding 向量化 → 存入向量库用户提问用户问题 → 查询优化改写 / 扩展→ 多路检索向量 ES→ Rerank 重排序 → 拼接上下文 → 大模型生成答案二、查询优化 3 种核心方式查询改写把短句、口语句改写成完整规范问句查询扩展给原问题加近义词、相关关键词拆分子问题复杂长问题拆成多个小问题分别检索三、Rerank 重排序核心作用对向量 / ES 初筛出来的候选片段二次精排过滤语义像但事实无关的噪音内容把真正相关的片段排到最前面提升答案准确率四、上下文拼接原则只拼接高相关片段不要堆无关内容控制长度不超大模型上下文窗口保留原文逻辑不随意拆分语句五、RAG 三大常见痛点检索不准分块不合理、嵌入模型不匹配幻觉依旧存在召回内容少、相关片段没找到上下文溢出塞太多文档超出模型长度限制六、RAG 两种架构朴素 RAG基础流程分块→向量化→检索→生成进阶 RAG加查询改写、Rerank、多路检索、文档重排七、面试必背一句完整流程文档经过预处理、分块、向量化存入向量库用户提问经过查询优化通过向量 ES 多路检索召回片段再经 Rerank 重排序拼接上下文喂给大模型生成答案。