RAG-day2

张

张建站

2026/5/8 8:38:41

10分钟阅读

一、文本分块作用长文档不能直接喂给大模型必须切成小块避免超出上下文限制、检索更精准。常见分块方式固定大小分块、按段落分块、按语义分块。分块原则块不能太大冗余多、不能太小语义不完整。二、向量化与嵌入模型嵌入模型Embedding 模型专门负责把文本转成向量的模型。特点语义越相似的文本转化后的向量数值越接近。作用是语义检索的基础没有向量化就做不了语义匹配。三、向量数据库定义专门用来存储向量、快速做相似度检索的数据库。和普通数据库区别普通库适合精确匹配向量库适合语义相似度匹配。常见用途存放文档块向量、用户问题向量供 RAG 快速检索。四、RAG 细化完整链路含隐藏子步骤文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库存向量数据库→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段用户提示词→ 大模型增强生成答案五、语义检索核心逻辑用户问题 → 转向量和向量库里所有文档块向量算相似度取出相似度最高的 Top-N 片段作为参考资料给大模型

SystemVerilog接口(interface)的‘隐形守护者’：时钟块(clocking block)如何让验证代码更健壮

SystemVerilog接口中的时钟块：验证工程师的时序守护者在数字验证的世界里，时序问题就像潜伏在暗处的幽灵，常常在最意想不到的时刻给验证工程师带来噩梦般的调试体验。想象一下这样的场景：你的测试平台(testbench)在仿真中完美运行…...

2026/5/8 8:37:33 阅读更多 →

终极免费NCM解密工具：3分钟解锁网易云音乐播放限制

终极免费NCM解密工具：3分钟解锁网易云音乐播放限制【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM格式文件无法在其他设备播放而困扰吗？ncmdump就是你需要的终极解决方案&#xff…...

2026/5/8 8:31:00 阅读更多 →

【AISMM评估实战指南】：SITS2026权威发布3大核心价值、5个落地陷阱与2026年合规窗口期倒计时

更多请点击： https://intelliparadigm.com 第一章：SITS2026演讲：AISMM评估的价值在SITS2026国际软件测试峰会上，AISMM（AI-Specific Software Maturity Model）评估框架首次系统性地揭示了AI系统工程化落地…...

2026/5/8 8:30:45 阅读更多 →

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 如果你正在为Zot…...

2026/5/7 22:07:22 阅读更多 →