“用向量 LLM 做向量化” vs “传统向量化算法”有什么区别？

张

张建站

2026/4/29 1:42:36

10分钟阅读

这里的“传统”一般指两类词袋/TF-IDF、以及经典句向量模型如 word2vec / doc2vec / 早期 sentence embedding。和你现在的 embedding 模型相比主要差异是1) 表达能力语义 vs 关键词embedding 模型你现在更擅长理解“意思相近但字不一样”的问题例用户问“解析域名趋势”就算元数据写的是“解析域名趋势/双折线”也能命中。TF-IDF/关键词更依赖字面重合容易漏掉同义表达但优点是可解释、稳定、便宜。2) 对中文/领域词的适应性现代 embedding如你这个 qwen3-embed对中文语义、句法、同义词通常更强对“自然语言问法”更友好。传统方法需要你做大量分词、同义词表、规则才能接近语义效果。3) 成本与延迟embedding API每次要调接口有网络/服务开销需要超时与降级我已在代码里做了回退。传统算法本地就算几乎零外部依赖延迟极低。4) 结果稳定性embedding 模型通常跨表述更稳但阈值要调模型升级可能改变向量空间需要回归。TF-IDF非常稳定、可控但语义泛化差。结合你现在的代码一句建议短期保持_ChartVectorIndex这种“内存向量API 回退字符串”的结构很适合你当前规模与“不持久化”的需求。中期多实例/重启不想重算/图表很多再迁到 PostgreSQL pgvector接口不变只替换search()的实现即可。

别再死记硬背AHP步骤了！用Excel+Python 5分钟搞定层次分析法一致性检验与权重计算

别再死记硬背AHP步骤了！用ExcelPython 5分钟搞定层次分析法一致性检验与权重计算在数学建模竞赛或课程作业中，层次分析法（AHP）是解决多准则决策问题的经典工具。但手动计算判断矩阵的一致性检验（CR）和权重…...

2026/4/29 1:35:30 阅读更多 →

本地mysql密码重置

第一步：准备工作关闭所有和 MySQL、DBeaver、CMD 相关的窗口，从头开始。如图：winR打开如下面板，然后确认找到正在运行的mysql服务，然后右键停止。以管理员身份打开 2 个「命令提示符」窗口（右键 CMD → 以管…...

2026/4/29 1:35:05 阅读更多 →

【VS Code MCP生态搭建权威指南】：20年IDE架构师亲授5大核心接入步骤与避坑清单

更多请点击： https://intelliparadigm.com 第一章：VS Code MCP生态搭建的底层逻辑与演进脉络 MCP协议的本质定位 Model Context Protocol（MCP）并非传统插件通信层，而是 VS Code 架构中面向 AI 原生工作流设计的**语义…...

2026/4/29 1:34:20 阅读更多 →

PowerShell脚本编译终极指南：如何用Win-PS2EXE轻松打包脚本为EXE文件

PowerShell脚本编译终极指南：如何用Win-PS2EXE轻松打包脚本为EXE文件【免费下载链接】PS2EXE Module to compile powershell scripts to executables 项目地址: https://gitcode.com/gh_mirrors/ps/PS2EXE 还在为PowerShell脚本分发而烦恼吗？每次…...

2026/4/28 9:20:28 阅读更多 →