大模型知识点必备
一、RAG 核心必背RAG检索增强生成先检索私有文档再给大模型参考生成答案。RAG 流程文档加载→文本分块→向量化→向量库存储→相似度检索→大模型生成。RAG 作用解决知识滞后、私有文档问答、降低幻觉、无需重训模型、成本低。向量库存储文本向量按相似度快速检索相关片段。幻觉成因大模型仅靠训练知识凭空编造。幻觉解决RAG 给上下文、优化提示词、调分块、调检索阈值、换 Embedding 模型。高级 RAGSelf-RAG、Agentic RAG自主判断是否检索、迭代检索。RAG 调优分块大小、检索条数、相似度阈值、Prompt、模型、Embedding 替换。二、Agent 智能体必背Agent基于大模型具备自主思考、推理、工具调用、记忆、任务拆解的智能体。普通大模型 vs Agent普通仅聊天无思考Agent 会推理、调工具、记上下文、拆复杂任务。ReAct 框架流程思考推理→行动调用→观察结果→整理输出。ReAct 作用自主决策、按需调工具、减少幻觉。Agent 工具联网搜索、RAG 知识库检索、代码 / 接口执行。短时记忆当前会话有效关闭即失效。长时记忆存向量库跨会话跨时间保留用户偏好。单 Agent处理简单独立任务。多 Agent分工协作、任务拆解适配复杂大型任务。Agent 完整流程用户提问→ReAct 思考→判断是否调工具→调用工具→获取结果→结合记忆→输出答案。三、LangChain 必背LangChain大模型应用开发框架快速搭建 RAG、Agent、业务工作流。四大核心模块Models 模型层、Prompts 提示词层、Chains 链层、Memory 记忆层。Models统一对接大模型、对话模型、Embedding 模型屏蔽厂商差异。Prompts提示词模板、变量动态注入、格式化输出。Chains串联多个组件组成自动化业务流水线。Memory保存对话历史维持多轮上下文连贯。常用组件DocumentLoaders 文档加载器、VectorStores 向量库对接、Tools/Agents 工具封装。LangChain 用途搭建 RAG、开发 Agent、构建工作流、一键切换大模型。四、提示词工程必背基础要素角色定位、任务描述、约束条件、输出格式、示例参考。少样本 Prompt给多个示例让模型按固定格式输出。思维链 CoT引导模型分步推理提升复杂问题准确率。Prompt 优化原则指令明确、约束清晰、格式固定、减少模糊表述。五、大模型微调基础必背微调在预训练大模型基础上用自有数据小幅训练适配专属业务场景。适用场景专属话术、行业术语、固定输出格式、私有知识固化。SFT有监督微调给标准问答对让模型学习指定输出风格。LoRA轻量化微调仅训练少量参数显存占用低、成本低、效果好。微调数据集规范问答对、格式统一、去重降噪、样本均衡。微调 vs RAGRAG 适合实时更新知识微调适合固定风格、固化私有知识。微调劣势成本高、周期长、更新数据需重调RAG 可实时更新无需重训。六、LLMOps 工程化必背LLMOps大模型应用工程化含模型管理、部署、监控、评测、成本管控。模型管理版本管理、开源模型下载、微调模型归档。部署上线模型封装接口、服务化部署、前后端联调。监控观测调用量、响应耗时、报错日志、幻觉率、用户提问统计。评测调优批量测试、打分评估、迭代优化模型与 Prompt。成本管控限制 Token 消耗、限流防滥用、统计计费、模型选型控成本。七、多模态大模型必背多模态融合文本、图片、PDF、表格、图像多种信息输入。OCR 大模型识别图片文字再做总结、问答、解析。CLIP图文对齐模型把图片和文本映射到同一向量空间。多模态 Embedding图文统一向量化用于检索匹配。多模态 RAG图文 / PDF / 表格文档分块向量化、检索、多模态问答。扫描件 PDF依赖 OCR 解析再走标准 RAG 流程。八、项目面试通用必背大模型应用开发不用训练底层模型只做框架组装、Prompt 调优、RAG/Agent 落地、部署运维。日常工作模型选型、参数调优temperature/top_p、Prompt 优化、RAG 调优、评测打分、接口封装、项目部署。行业前景大模型是十年级基础设施非短期风口未来成程序员基础技能。难度对比前端大模型应用传统后端前端转适配度高。三个必做项目RAG 知识库、Agent 办公助手、多模态文档问答。部署流程开发调试→接口封装→服务器部署→日志监控→前后端联调→上线迭代。九、核心参数必背temperature温度数值越高随机性越强越低越严谨。top_p控制输出多样性截断概率累积采样。max_tokens限制模型最大生成长度。重复惩罚抑制模型重复话术。