RAG-day7

张

张建站

2026/5/8 17:23:28

10分钟阅读

一、RAG 整体完整流程必考文档入库原始文档 → 文本预处理 → 智能分块 → Embedding 向量化 → 存入向量库用户提问用户问题 → 查询优化改写 / 扩展→ 多路检索向量 ES→ Rerank 重排序 → 拼接上下文 → 大模型生成答案二、查询优化 3 种核心方式查询改写把短句、口语句改写成完整规范问句查询扩展给原问题加近义词、相关关键词拆分子问题复杂长问题拆成多个小问题分别检索三、Rerank 重排序核心作用对向量 / ES 初筛出来的候选片段二次精排过滤语义像但事实无关的噪音内容把真正相关的片段排到最前面提升答案准确率四、上下文拼接原则只拼接高相关片段不要堆无关内容控制长度不超大模型上下文窗口保留原文逻辑不随意拆分语句五、RAG 三大常见痛点检索不准分块不合理、嵌入模型不匹配幻觉依旧存在召回内容少、相关片段没找到上下文溢出塞太多文档超出模型长度限制六、RAG 两种架构朴素 RAG基础流程分块→向量化→检索→生成进阶 RAG加查询改写、Rerank、多路检索、文档重排七、面试必背一句完整流程文档经过预处理、分块、向量化存入向量库用户提问经过查询优化通过向量 ES 多路检索召回片段再经 Rerank 重排序拼接上下文喂给大模型生成答案。

用PyTorch和GAN生成MNIST数字：从环境配置到模型训练的完整指南

用PyTorch和GAN生成MNIST数字：从环境配置到模型训练的完整指南在人工智能的众多应用中，生成对抗网络（GAN）无疑是最具创造力的技术之一。想象一下，计算机能够凭空创造出逼真的图像、音乐甚至视频，这听起来像…...

2026/5/8 17:22:54 阅读更多 →

嵌入式可编程性：eFPGA如何成为应对芯片设计风险与碎片化市场的关键技术

1. 嵌入式可编程性的“迟到”与“必然”在半导体行业摸爬滚打了十几年，我亲眼见证了无数技术概念的潮起潮落。有些是昙花一现，有些则像一场漫长的马拉松，比如我们今天要聊的“嵌入式可编程性”。这个概念，说白了就是把FPGA&#x…...

2026/5/8 17:21:26 阅读更多 →

大学计算机专业学C语言好吗 2027就业前景如何

对于计算机专业的学生，C语言不是一个“可选项”，而是一个“必选项”和“优选项”。它的价值远超语言本身：理解计算机的“底层逻辑”：C语言直接操作内存、指针、地址，这迫使你去理解数据在内存中如何存储、函数调用时栈…...

2026/5/8 17:20:23 阅读更多 →

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 如果你正在为Zot…...

2026/5/7 22:07:22 阅读更多 →