构建个人AI知识库：基于提示工程的轻量级RAG方案实践

张

张建站

2026/5/18 22:25:23

10分钟阅读

1. 项目概述一个为个人知识库量身定制的AI提示工程仓库最近在整理自己的技术笔记和项目文档时我遇到了一个很多开发者都有的痛点资料越攒越多但想用的时候却找不到或者找到了也只是一堆零散的信息没法快速提炼出核心。比如上周我想回顾一下之前做的一个微服务鉴权方案结果在十几个Markdown文件里翻了半天最后只拼凑出个大概。这让我意识到单纯的文件堆积不是知识管理高效地“唤醒”和“使用”这些知识才是关键。于是我动手搭建了这个名为genai_prompt_myshelf的私人项目。它的核心目标很明确将我个人的、零散的知识库MyShelf与当前强大的生成式AIGenAI能力结合起来通过精心设计的提示词Prompt实现知识的智能检索、总结、问答甚至创作辅助。简单说它不是一个通用的AI应用而是完全围绕我个人知识体系和工作流定制的“提示词工程”工具箱。这个项目特别适合像我一样的开发者、技术写作者或任何需要深度管理专业领域知识的人。如果你也受困于信息过载希望让AI成为你专属的“第二大脑”而不仅仅是闲聊工具那么这个项目的思路和实现细节或许能给你带来不少启发。接下来我就详细拆解一下我是如何设计并实现它的。2. 核心设计思路从文件堆到智能工作流在开始敲代码之前我花了大量时间思考整个系统的设计哲学。我不想做一个大而全的、试图解决所有人问题的平台那会变得非常复杂且难以维护。我的核心思路是“轻量、聚焦、可演进”。2.1 为什么选择提示工程作为核心市面上已经有很多优秀的向量数据库和RAG检索增强生成方案比如LangChain、LlamaIndex等。它们功能强大但对于个人知识库来说往往显得“杀鸡用牛刀”。部署、维护成本高而且很多功能我用不上。我选择以提示工程为核心基于几个关键考量成本与复杂度最低我不需要维护一个独立的向量数据库服务知识以原始文件Markdown, PDF, 代码片段形式存储通过文件系统和简单的元数据管理即可。AI模型调用通过API如OpenAI, Claude, 或本地模型完成架构极其简单。控制力最强提示词是我与AI沟通的“编程语言”。通过精心设计提示词我可以精确控制AI如何理解我的问题、从哪些文件中寻找信息、以什么格式和风格输出。这比黑盒的RAG检索给了我更多的透明度和调整空间。与个人工作流无缝集成我的知识产出本身就是Markdown笔记、代码注释和项目文档。系统可以直接读取这些原生格式无需复杂的预处理。生成的提示词和AI回复也可以直接插入回我的笔记或代码中形成闭环。2.2 系统架构的简单拆解整个项目的架构可以概括为“三层两库”知识源层这是我的原始知识文件存放在特定的目录下例如notes/,code_snippets/,papers/。我约定使用Markdown作为主要格式因为它结构清晰兼容性好。索引与检索层这一层负责“理解”我的知识库。它不做复杂的语义嵌入而是构建一个轻量级的“关键词-上下文”索引。具体来说我会为每个文件提取标题、主要章节标题、标签和出现频率高的技术术语形成一个本地的小型索引文件如JSON格式。当用户查询时系统首先在这个索引中进行关键词匹配和简单的相关性排序快速定位到最相关的几个文件。提示构造与执行层这是核心。系统会根据检索到的文件内容动态构造一个给大语言模型的提示词。这个提示词通常包含系统指令定义AI的角色如“你是一位资深的后端架构师”和任务边界。上下文从相关文件中提取的、与问题最相关的片段。用户问题我的原始查询。输出格式要求明确要求AI以要点、代码块、对比表格等形式回答。两库提示词模板库存放针对不同任务的预制提示词模板。例如“代码解释”、“错误排查”、“概念对比”、“周报生成”等每个模板都有不同的结构和指令。会话历史库记录重要的问答会话方便回溯和迭代优化提示词。这个架构的优势在于它完全由文本文件驱动没有任何外部数据库依赖备份和迁移就是复制文件夹非常符合个人项目的“轻量”诉求。3. 关键技术实现细节理论说完了我们来看看具体是怎么做的。我会以几个核心功能模块为例展示实现的关键代码和设计逻辑。3.1 知识文件的组织与元数据提取我采用基于目录的分类方式这符合大多数人的习惯。myshelf/ ├── notes/ │ ├── backend/ │ │ ├── microservices_auth.md │ │ └── database_sharding.md │ └── frontend/ │ └── react_performance.md ├── code_snippets/ │ └── python_async_patterns.py └── .meta/ └── index.json # 自动生成的索引文件元数据提取脚本indexer.py的核心部分会遍历这些目录import os import json import re from pathlib import Path def extract_metadata(file_path): 从Markdown文件中提取标题、章节和关键词 with open(file_path, r, encodingutf-8) as f: content f.read() metadata { path: str(file_path), title: , headings: [], tags: [], keywords: [] } # 提取标题第一个#标记 title_match re.search(r^#\s(.)$, content, re.MULTILINE) if title_match: metadata[title] title_match.group(1) # 提取所有章节标题#和## headings re.findall(r^#{1,2}\s(.)$, content, re.MULTILINE) metadata[headings] headings # 简单关键词提取这里可以替换为更复杂的NLP库如jieba # 移除代码块和链接提取出现频率高的名词性词汇 words re.findall(r\b[A-Za-z]{3,}\b, content.lower()) from collections import Counter common_words Counter(words).most_common(10) metadata[keywords] [w for w, _ in common_words if w not in common_stop_words] # 提取标签假设格式为 tags: [python, async, coroutine] tag_match re.search(rtags:\s*\[(.?)\], content) if tag_match: metadata[tags] [t.strip() for t in tag_match.group(1).split(,)] return metadata注意这里的元数据提取非常基础。对于生产级或个人深度使用可以考虑集成spaCy或NLTK进行实体识别和更准确的关键词提取。但对于启动项目简单规则已经能带来巨大效率提升。3.2 轻量级检索关键词匹配与相关性排序我们没有使用向量相似度计算而是采用了一种结合了关键词匹配、路径相关性和新鲜度的简单算法。def search_index(query, index, top_k5): 在索引中搜索相关文档 query_terms set(query.lower().split()) scored_docs [] for doc in index: score 0 # 1. 标题匹配权重最高 if any(term in doc[title].lower() for term in query_terms): score 3 # 2. 标签匹配 tag_match len(query_terms.intersection(set(doc[tags]))) score tag_match * 2 # 3. 关键词匹配 keyword_match len(query_terms.intersection(set(doc[keywords]))) score keyword_match # 4. 路径相关性例如查询“后端鉴权”backend/目录下的文件加分 if backend in query and backend in doc[path]: score 1 if score 0: # 5. 新鲜度加分假设元数据里有last_modified # 这里简化处理新文件有微小加分 scored_docs.append((score, doc)) # 按分数排序返回前top_k个 scored_docs.sort(keylambda x: x[0], reverseTrue) return [doc for _, doc in scored_docs[:top_k]]这个检索逻辑虽然简单但在个人知识库场景下非常有效。因为你的查询往往和你自己创建文件时使用的词汇高度一致。它的速度极快完全在内存中完成。3.3 提示词模板引擎动态构造上下文这是项目的灵魂。我设计了一个简单的模板系统使用Jinja2作为模板引擎。一个典型的“代码解释”模板templates/code_explain.j2可能长这样你是一个经验丰富的软件工程师擅长解释复杂的技术概念。请根据我提供的代码片段和相关上下文回答我的问题。 **相关上下文文档摘要** {% for doc in context_docs %} - [{{ doc.title }}]: {{ doc.summary }} {% endfor %} **问题** {{ user_query }} **需要解释的代码** {{ code_language }} {{ code_snippet }}请按以下结构回答功能概述用一两句话说明这段代码是做什么的。关键逻辑拆解分步骤解释代码的核心执行流程。技术要点指出代码中使用的关键编程范式、库或技巧。潜在改进点基于上下文中的设计模式建议1-2个可能的优化方向。请确保解释专业且易于理解。构造提示词的Python代码 python from jinja2 import Environment, FileSystemLoader class PromptBuilder: def __init__(self, template_dir./templates): self.env Environment(loaderFileSystemLoader(template_dir)) def build_prompt(self, template_name, context_docs, user_query, **kwargs): template self.env.get_template(f{template_name}.j2) # 准备上下文从检索到的文档中提取最相关的段落 prepared_context [] for doc in context_docs: # 这里实现一个函数根据query从doc全文提取最相关的1-2个段落 relevant_snippet extract_relevant_snippet(doc[full_content], user_query) prepared_context.append({ title: doc[title], summary: relevant_snippet[:200] ... # 摘要 }) prompt template.render( context_docsprepared_context, user_queryuser_query, **kwargs # 其他变量如code_snippet, code_language等 ) return prompt通过这种方式我可以轻松管理几十种针对不同场景的提示词模板并且能动态注入最相关的知识上下文极大地提升了AI回复的准确性和实用性。3.4 与AI模型的交互封装为了兼容不同的AI后端OpenAI API, Claude API 或本地运行的Ollama我编写了一个统一的适配层。import openai from typing import Dict, Any class AIClient: def __init__(self, backendopenai, **config): self.backend backend self.config config if backend openai: openai.api_key config.get(api_key) self.model config.get(model, gpt-4) def generate(self, prompt, system_messageNone, **kwargs): if self.backend openai: messages [] if system_message: messages.append({role: system, content: system_message}) messages.append({role: user, content: prompt}) response openai.ChatCompletion.create( modelself.model, messagesmessages, temperaturekwargs.get(temperature, 0.1), # 低温度保证稳定性 max_tokenskwargs.get(max_tokens, 1500) ) return response.choices[0].message.content # 可以扩展其他后端如Claude、Ollama等 elif self.backend ollama: # 调用本地Ollama API pass else: raise ValueError(fUnsupported backend: {self.backend})实操心得温度参数temperature的设置非常关键。对于知识检索和总结类任务我通常设置为0.1-0.3让AI的输出更确定、更少“胡言乱语”。对于头脑风暴或创意写作可以调到0.7以上。4. 核心工作流与实操案例光说不练假把式我来演示一个完整的实操流程看看这个系统如何解决我开篇提到的“寻找微服务鉴权方案”的问题。4.1 场景还原与系统交互我的知识库里有一个文件notes/backend/microservices_auth.md里面记录了我之前调研的JWT、OAuth2.0、API Gateway集成等方案。提出问题我在命令行工具或简单的Web界面中输入“微服务之间如何安全地进行认证比较JWT和OAuth2.0的优劣。”系统后台处理检索search_index函数被调用查询词被拆分为[“微服务” “安全” “认证” “jwt” “oauth2.0”]。索引发现microservices_auth.md文件的标题、标签和关键词高度匹配得分最高被选中。上下文提取系统读取该Markdown文件全文并使用简单的文本匹配算法找到包含“JWT”、“OAuth2.0”、“认证流程”等关键词的段落。提示词构造系统选择templates/compare_concepts.j2模板将提取的上下文片段和我的原始问题填入模板。调用AI构造好的、包含具体上下文的提示词被发送给配置好的AI模型例如GPT-4。获得答案几秒后我收到一份结构清晰的回答首先概述了微服务间认证的常见挑战。以表格形式对比了JWT和OAuth2.0在适用场景、流程复杂度、令牌管理、性能开销等方面的差异。结合我笔记中提到的具体网关如Kong配置片段给出了一个简单的集成建议。最后还根据我笔记里记录的“某次生产环境令牌泄露”的教训补充了安全最佳实践。这个过程相当于一个极度了解我技术背景和知识储备的专家在帮我快速整理和输出答案。效率远超我自己翻找和重组信息。4.2 更多实用场景示例这个系统的应用远不止于问答。通过切换提示词模板它可以化身多种工具学习伙伴读一篇新的技术文章PDF或网页用“总结与提问”模板让AI生成文章摘要并提出几个关键问题帮我深化理解。写作助手写技术博客时用“文章扩写”模板提供几个要点让AI帮我生成初稿段落或检查逻辑是否通顺。代码审查提交一段新代码用“代码审查”模板让AI结合我知识库里的编码规范文档指出潜在的风格问题和bug。周报生成输入本周完成的几个任务关键词用“周报生成”模板让AI参考过往周报的格式和口吻自动生成初稿。关键在于所有这些场景的提示词都预置在我的模板库里并且每次调用都会自动关联我知识库中的相关内容保证输出的内容不是通用的AI套话而是真正贴合我个人知识体系和需求的定制化内容。5. 部署、优化与避坑指南5.1 本地部署与使用这个项目被设计为纯本地优先的工具。部署非常简单克隆仓库git clone https://github.com/bsc7080gbc/genai_prompt_myshelf.git安装依赖pip install -r requirements.txt主要是openai, jinja2等配置复制config.example.yaml为config.yaml填入你的AI API密钥和知识库路径。初始化索引运行python indexer.py --init来扫描你的知识目录并创建初始索引。运行交互界面可以是一个简单的命令行工具python cli.py也可以是一个用Gradio或Streamlit搭建的轻量级Web UI。我强烈建议将索引更新设置为自动化例如通过Git钩子在提交笔记时触发或一个简单的定时任务cron job。5.2 提示词迭代与优化技巧提示词工程是一个持续迭代的过程。我的经验是从简单开始先写一个能完成核心任务的简单提示词确保它能运行。记录与评估每次使用后如果结果不理想不要直接丢弃。将问题、使用的提示词、上下文和不满意的输出保存到“失败案例”日志中。分析模式定期回顾“失败案例”寻找共同点。是上下文提供得不够是指令不清晰还是输出格式要求太模糊小步快跑持续优化基于分析有针对性地修改提示词模板。例如如果AI经常忽略关键细节就在系统指令里强调“请务必关注以下细节...”如果格式总是不对就提供更明确的示例Few-Shot Learning。我建立了一个prompt_lab/目录专门用来做A/B测试对比不同提示词版本的效果。5.3 常见问题与排查在实际使用中你可能会遇到以下问题问题现象可能原因解决方案AI回答“未在提供上下文中找到相关信息”1. 检索失败没找到相关文档。2. 上下文片段提取不准确没包含关键信息。1. 检查索引是否更新。尝试在查询中使用更具体、更可能出现在文档中的关键词。2. 优化extract_relevant_snippet函数尝试用更精细的段落分割如按“\n\n”分割和更简单的关键词匹配。AI回答包含事实性错误或“幻觉”1. AI模型本身的知识与你的私人知识冲突。2. 上下文信息不足AI开始自行编造。1. 在系统指令中强烈强调“请严格依据提供的上下文回答如果上下文未提及请明确说明‘根据提供的信息无法回答’”。2. 增加上下文的篇幅或提供更多相关文档。回答格式不符合要求提示词中对输出格式的指令不够强硬或清晰。在提示词末尾使用明确的格式描述如“请务必以Markdown表格形式输出”甚至可以提供一个表格表头的示例。处理长文档时性能慢或API令牌超限检索到的文档太长导致提示词超出模型令牌限制。实现更智能的上下文截断或总结。例如先让AI对长文档进行分段总结再将总结作为上下文而不是全文灌入。5.4 安全与成本考量隐私所有知识文件都在本地只有你选择的上下文片段会被发送到AI API。对于极度敏感的信息可以在文件中添加特殊标记如#private让索引器跳过它或者直接使用本地大模型如通过Ollama运行Llama 3。成本使用GPT-4等商用API会产生费用。控制成本的关键是精细化上下文管理。只发送必要的片段使用max_tokens参数限制回复长度。对于简单的检索任务可以优先使用更便宜的模型如GPT-3.5-Turbo。构建genai_prompt_myshelf的过程与其说是在开发一个工具不如说是在系统地梳理和升级我个人的知识管理方法论。它强迫我将零散的知识结构化并思考如何与AI高效协作。这个项目目前已经完全融入我的日常工作流它就像一个永远在线的、极度了解我专业领域的助理显著提升了我的学习和工作效率。如果你也受困于信息碎片化不妨试试这个思路从搭建一个属于自己的“提示词书架”开始。

观察 Taotoken 在多模型间路由的响应表现与容灾切换体感

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度观察 Taotoken 在多模型间路由的响应表现与容灾切换体感在构建依赖大模型的应用时，服务的稳定性是核心考量之一。单一…...

2026/5/18 22:18:29 阅读更多 →

Git提交规范自动化：Husky与Commitlint提升团队协作效率

1. 项目概述：一个被低估的开发者效率神器如果你和我一样，每天都要在终端里敲下几十次 git commit -m “fix: xxx” ，并且每次都要纠结于提交信息的格式、规范，甚至因为一个拼写错误而不得不重新修改提交，那么你一定…...

2026/5/18 22:10:24 阅读更多 →

Pearcleaner：你的Mac数字园丁，为什么80%的用户卸载应用后依然在浪费存储空间？

Pearcleaner：你的Mac数字园丁，为什么80%的用户卸载应用后依然在浪费存储空间？ 【免费下载链接】Pearcleaner A free, source-available and fair-code licensed mac app cleaner 项目地址: https://gitcode.com/gh_mirrors/pe/Pearcleaner …...

2026/5/18 22:09:23 阅读更多 →