一、文本分块作用长文档不能直接喂给大模型必须切成小块避免超出上下文限制、检索更精准。常见分块方式固定大小分块、按段落分块、按语义分块。分块原则块不能太大冗余多、不能太小语义不完整。二、向量化与嵌入模型嵌入模型Embedding 模型专门负责把文本转成向量的模型。特点语义越相似的文本转化后的向量数值越接近。作用是语义检索的基础没有向量化就做不了语义匹配。三、向量数据库定义专门用来存储向量、快速做相似度检索的数据库。和普通数据库区别普通库适合精确匹配向量库适合语义相似度匹配。常见用途存放文档块向量、用户问题向量供 RAG 快速检索。四、RAG 细化完整链路含隐藏子步骤文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库存向量数据库→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段 用户提示词→ 大模型增强生成答案五、语义检索核心逻辑用户问题 → 转向量和向量库里所有文档块向量算相似度取出相似度最高的 Top-N 片段作为参考资料给大模型