RAG被忽视的盲点,DualGraph解决了
想象你在一个电商网站上问 AI「列出所有同时支持无线充电和 eSIM 的三星手机。」传统的 RAG 系统会把问题变成向量然后找语义最相近的文档块。但它会返回什么一堆包含「无线充电体验超棒」的营销文案然后漏掉了规格表里确切的型号列表。这不是 RAG 不够好是语义检索本身就有盲区。当你需要的是「精确过滤」和「穷举列表」靠「语义相似度」再准也没用。Samsung AI 的一篇新论文提出了 DualGraph用两张图解决了一个问题同一份文档集应该同时有模糊检索和精确查询两种入口。致命盲区当「像」不如「是」标准 RAG 的工作方式很简单把问题和文档都变成向量找余弦相似度最高的十来段塞给 LLM 出答案。这个方法对开放式问题极其有效——「这款手机怎么样」「有哪些适合老年人的手机」——都能找到相关内容。但一旦问题变成「列出所有支持 HDMI 2.1 且刷新率超过 120Hz 的电视」「有哪些手机同时支持 5G 和 eSIM并且价格低于 400 英镑」「比较 Galaxy S 系列和 A 系列的电池容量」语义检索就露馅了。原因很简单语义相似度只知道「像不像」不知道「是不是」。它能找到包含「5G」「eSIM」「价格」这些词的文档块但它不知道哪些产品真的同时满足这些条件需要逻辑与运算是不是所有满足条件的产品都列出来了需要穷举而不是 Top-K价格 399 是不是小于400需要数值比较这些操作都是符号系统的强项——SPARQL、SQL、规则引擎——但它们的问题是扛不住自然语言的噪声和歧义。「支持 5G」在规格表里可能写成「5G Sub6」「5G mmWave」「NR CA」等完全不同的表达。DualGraph 的核心思路DualGraph 的做法很直接同一份文档集构建两张互补的图按需调用。TKG文本知识图谱给模糊问题兜底TKG 是一个无向实体图。每个节点是一个实体产品、功能、类别附带一段从所有相关文档块聚合生成的文本描述。检索的时候先找与问题最相似的实体再用实体投票选出最相关的文档块。这张图保留了自然语言的上下文和歧义适合处理开放式问题。你不确定用户用「无线充电」还是「Qi charging」还是「感应式充电」TKG 的语义匹配都能兜住。SKG符号知识图谱给精确查询兜底SKG 是一个有向三元组图产品 → 价格 → 399产品 → 支持 → 5G产品 → 屏幕类型 → AMOLED。每个三元组都是类型化的 subject-predicate-object支持 SPARQL 精确查询。关键不在于「又建了一个知识图谱」而在于建图的细节从半结构化数据自动提取不是手工标注而是从产品页面的规格表自动解析 triples数值归一化原始文本里的「6.7 英寸」「6.7-inch」「6.7」被统一成可比较的数值格式规则推理Datalog 规则自动推导高阶特征——如果产品支持 5G 的几个子标准就推断「支持 5G」图模式检索辅助 SPARQL 生成不是让 LLM 盲写 SPARQL而是先检索最相关的图模式片段做 grounded 生成7 种编排策略怎么组合最有讲究DualGraph 不止有双图还提供了 7 种组合策略策略做法适用场景TKG only只用语义检索开放式推荐SKG only只用符号查询纯规格过滤TKGSKG concat两种结果拼接需要全面信息的复杂问题SKGTKG fallback先符号失败则语义规格为主 兜底RouterLLM 判断走哪条问题类型分布均衡RouterTKG fallback路由 语义兜底通用场景最优AgenticLLM agent 迭代调整极复杂的多步推理实验证明SKGTKG fallback 在精确查询列表匹配上最强RouterTKG fallback 在通用场景事实正确性上最强。SpecsQA让 RAG 系统在真实电商场景下裸考论文还贡献了一个新基准 SpecsQA从 2025 年 11 月的三星英国官网抓了 2162 个产品页面涵盖 26 个产品类别。手工编写了 117 个问题分为四类反向查询哪些产品满足某属性如「列出所有支持 eSIM 的手机」多条件组合同时满足多个约束如「5G AMOLED 电池 4000mAh」群组对比跨产品线比较如「Galaxy S 和 A 系列的屏幕尺寸对比」推理类更开放的推荐和偏好场景因为用的是历史快照答案不回随时间变化避免了 LLM 靠预训练记忆「作弊」。同时提供了自然语言答案和符号列表两种标注方便不同维度评估。实验结果在所有指标上DualGraph 都超越了现有最好方法事实正确性Factual CorrectnessRouterTKG fallback 最高。RAPTOR 是最强的纯语义基线但在精确过滤类问题上明显吃亏。列表匹配List MatchSKGTKG fallback 最高。Wikontic 是最强的纯符号基线但索引和查询成本高得多且开放问题上不如 DualGraph。成本效率DualGraph 的索引成本与 HippoRAG2 / AriGraph 相当远低于微软 GraphRAG 和 Wikontic。消融实验揭示了一个关键发现SKG 的 SPARQL 查询质量高度依赖Spec 图模式——去掉它后SPARQL 生成成功率大幅下降事实正确性和列表匹配都受到严重影响。而 Category 模式反而是多余的去掉后性能还有小幅提升。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】