9.6k Star！阿里这款新开源 AI 数据库，RAG 直接降低 90% 成本！

张

张建站

2026/5/23 14:02:16

10分钟阅读

9.6k Star！阿里这款新开源 AI 数据库，RAG 直接降低 90% 成本！

这是一个或许对你有用的社群一对一交流/面试小册/简历优化/求职解惑欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料《项目实战视频》从书中学往事中“练”《互联网高频面试题》面朝简历学习春暖花开《架构 x 系统设计》摧枯拉朽掌控面试高频场景题《精进 Java 学习指南》系统学习互联网主流技术栈《必读 Java 源码专栏》知其然知其所以然这是一个或许对你有用的开源项目国产Star破10w的开源项目前端包括管理后台、微信小程序后端支持单体、微服务架构RBAC权限、数据权限、SaaS多租户、商城、支付、工作流、大屏报表、ERP、CRM、AI大模型、IoT物联网等功能多模块https://gitee.com/zhijiantianya/ruoyi-vue-pro微服务https://gitee.com/zhijiantianya/yudao-cloud视频教程https://doc.iocoder.cn【国内首批】支持 JDK17/21SpringBoot3、JDK8/11Spring Boot2双版本来源先把 RAG 部署的尴尬摆桌面横向对比放到 Milvus / Pinecone / Chroma 里看清位置研发能用它干啥5 个真实场景核心能力来自官方 README30 秒上手pip install 一行装好真实边界用之前要知道的 3 件事我的判断先把 RAG 部署的尴尬摆桌面做 RAG 应用的同学这两年多半都被同一件事卡过——为了几千条 PDF 切片做向量检索——你得先部署一整套 Milvus 集群3 个 etcd 节点做服务发现2 个 MinIO 节点做对象存储1 个 Pulsar做异步队列还要再来一组 Milvus Server 做查询节点。业务代码 200 行基础设施 yaml 2000 行——光部署就比业务代码大 10 倍。这就是杀鸡用牛刀——为了一个内部知识库做语义搜索你得拖一队分布式数据库基建上场。这种尴尬正好是阿里这款新开源的 AI 数据库要解决的——它把向量检索的形态从独立服务集群压回到嵌入式库——你pip install/npm install一下丢进 FastAPI / Node 进程里直接跑——Java 团队走 Python 边车的方案整个 RAG 应用也能从 5 台 K8s Pod 压回到 1-2 个进程。它叫Zvec——官方定位 *A lightweight, lightning-fast, in-process vector database*轻量、闪电级快、跑在进程里的向量数据库。截至本文发稿 GitHub Star9.6k——比刚开源那阵涨了快 25%仓库 https://github.com/alibaba/zvec官网 https://zvec.org。关键词只有一个——嵌入式。它不是一个独立运行的服务、是一个能直接pip install/npm install丢进你 Python / Node 进程里跑的库——跟 SQLite 的形态一模一样。这就是为什么官方给它起了个绰号「向量数据库界的 SQLite」。基于 Spring Boot MyBatis Plus Vue Element 实现的后台管理系统用户小程序支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能项目地址https://github.com/YunaiV/ruoyi-vue-pro视频教程https://doc.iocoder.cn/video/横向对比放到 Milvus / Pinecone / Chroma 里看清位置向量数据库这个赛道头部就这几家——把 Zvec 放进生态里看清楚位置工具形态部署成本适合规模致命短板Milvus独立服务集群高etcd / MinIO / Pulsar亿级以上小项目用就是杀鸡用牛刀Pinecone商用 SaaS极低直接 API亿级收费数据出境国内访问慢Chroma嵌入式服务态都支持中千万级Python 一等公民Java / Go 弱Zvec嵌入式进程内极低pip 一行百万到千万级 / 单机读密集起步晚不解决多机分片亿级生产仍需 MilvusZvec 的差异化生态位很清楚——不是替代 Milvus——是替代「Milvus 杀鸡用牛刀」的那批场景。一个内部知识库 RAG、一个端侧 AI 检索、一个手机 App 的本地搜索——这些场景过去要么硬上 Milvus、要么自己用 Faiss 拼一个现在直接pip install zvec就完事。基于 Spring Cloud Alibaba Gateway Nacos RocketMQ Vue Element 实现的后台管理系统用户小程序支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能项目地址https://github.com/YunaiV/yudao-cloud视频教程https://doc.iocoder.cn/video/研发能用它干啥5 个真实场景按使用频率从高到低场景 1RAG 应用的本地知识库最高频公司内部知识库比如 Confluence 导出的 5 万篇文档切片后做 embedding 入向量库。这种规模上 Milvus 是浪费——Zvec 直接嵌进 FastAPI / Node 进程Java 团队走 Python 边车——原本要 5 台 K8s Pod 的部署链路现在 1-2 个进程搞定。场景 2端侧 AI 检索手机 App / IoT 设备需要本地做语义搜索——文档不能传云端、模型要离线跑。Zvec 的 mmap 文件存储正好——用户的 5GB 笔记 embedding 数据全部存在手机本地——零网络调用。场景 3单元测试 / 集成测试写 RAG 应用的单测时——不可能每跑一个 case 都拉起 Milvus。Zvec 进程内启动——单测里setUp()直接 new 一个内存版 Zvec——跑完测试自动销毁——跟用 H2 替代 MySQL 跑单测是一个套路。场景 4边缘节点部署CDN 边缘节点 / 5G MEC 节点 / 车载计算单元——不允许独立部署一个数据库服务。Zvec 跟着业务进程一起部署——资源开销几乎可以忽略。场景 5原型验证 / DemoPoC 阶段验证一个 AI 想法——你不会为了一个 demo 配 Milvus 集群。Zvec 让你 30 秒就能从 0 到能跑的 RAG demo——验证完再决定要不要上 Milvus。核心能力来自官方 READMEZvec 的强项不只是嵌入式。README 宣称可Searches billions of vectors in milliseconds——说明底层检索能力很强、不是玩具级但工程选型上——综合单机进程内多读单写没有多机分片这几个边界来看Zvec 真正的甜蜜点是百万到千万级、单机读密集的 RAG 场景——真到亿级生产仍然推荐走 Milvus 这一档这一点和文末真实边界段保持一致——别被 README 的宣称数字带偏。按 README 列出的核心能力零部署进程内即用——通过pip/npm安装、不起独立服务——这是和 Milvus / Pinecone 形态上的根本区别数据本地化——所有数据落本地文件、查询也在本地完成——*Pure local, no servers, no config, no fuss*官方原话稠密稀疏向量混合——原生支持 dense / sparse 双向量类型——做混合搜索时不用自己拼混合搜索——向量相似度标量字段过滤按时间、类目、租户 ID 过滤一次完成不是后过滤WAL 持久化——写前日志保证 crash 后数据不丢——这块用过 MySQL 的同学很熟悉多进程并发读、单进程互斥写——多读单写的锁模型跟 SQLite 一模一样——适合读密集偶尔批量写的 RAG 场景跨平台二进制——Linux x86_64 / ARM64、macOS ARM64、Windows x86_64 全覆盖树莓派也能跑官方 Python / Node 绑定——Python 3.10-3.14 / Node.js 都有官方包——其他语言可以走 C 直接调。最新版本v0.3.12026 年 4 月刚改善了 Windows 路径处理放宽了 collection 限制——还在快速迭代。30 秒上手pip install 一行装好pip install zvec按官方 README 写一个最小的语义搜索 demoimport zvec # 1. 定义 collection schema向量字段维度 schema zvec.CollectionSchema( nameexample, vectorszvec.VectorSchema(embedding, zvec.DataType.VECTOR_FP32, 4), ) # 2. 在本地路径创建并打开 collection collection zvec.create_and_open(path./zvec_example, schemaschema) # 3. 写入文档每条文档带 id 向量数据 collection.insert([ zvec.Doc(iddoc_1, vectors{embedding: [0.1, 0.2, 0.3, 0.4]}), zvec.Doc(iddoc_2, vectors{embedding: [0.2, 0.3, 0.4, 0.1]}), ]) # 4. 向量相似度搜索 results collection.query( zvec.VectorQuery(embedding, vector[0.4, 0.3, 0.3, 0.1]), topk10, )整个流程跟 SQLite 写 SQL 一样直观——没有任何先要部署服务、配置网络、设置认证的环节。混合搜索向量标量字段过滤等高级用法可以参照官方 README 拿到完整 schema 写法。如果用 Java——Zvec 没有官方 Java 绑定——可选两条路Python / Node 边车推荐跑一个独立的 Python / Node 微服务包 Zvec对外暴露 HTTP 接口Java 主服务通过 RestTemplate / WebClient 调用——接入成本 1 天自行 C API / JNI 封装Zvec 内核是 C、有 C ABI——可以走 JNI / JNA 自己包一层 Java SDK——成本高适合愿意贡献开源的团队。业务侧的 OpenAI-compatible 网关可以走 yudao-cloud 的 AI 模块——把调 embedding 模型调 Zvec 边车拼 prompt这条 RAG 链路统一起来。yudao-cloud 仓库https://github.com/YunaiV/yudao-cloud真实边界用之前要知道的 3 件事按破坏力从高到低边界 1单机方案分布式不是它的目标最常见Zvec 的设计就是进程内嵌入式——不解决亿级多机分片的问题。如果你的向量量级到了10 亿——老老实实上 Milvus / TiDB Vector / PolarDB-X 向量版。Zvec 的甜蜜点是百万到千万级——刚好覆盖 80% 的内部知识库 / 端侧 / 中小型 RAG 项目。Milvus 仓库https://github.com/milvus-io/milvus边界 2Java 生态没有官方一等支持常见官方 README 里只列了 Python / Node 绑定。Java 团队想用要么走 JNI 自己包一层成本高、要么单独跑一个 Python 边车进程对外提供 HTTP 接口。这点对国内 Java 后端不太友好——希望阿里后续补一个 Java SDK。边界 3写入吞吐相比 Milvus 弱高级场景嵌入式形态的天然限制——写入要走单进程互斥锁。如果你的场景是「每秒 10 万条向量入库」比如实时日志向量化——Zvec 不是最佳选择——这种场景 Milvus 的分布式写入才是答案。Zvec 适合读密集批量小规模写——不适合实时高吞吐写入。我的判断向量数据库这个赛道这两年很热闹——头部 Milvus / Pinecone 已经跑出来——但「为一个小 RAG 部署一整套 Milvus」的痛点一直没解决。Zvec 抢的就是这个空缺——一行 pip 装上、零部署、跑在进程里。它的反向定位很清晰——「我不是 Milvus我是 Milvus 不该出现的那个场景的答案」。如果你最近在考虑做内部知识库 RAG、端侧 AI 检索、给业务系统加个语义搜索功能——Zvec 应该是你第一个尝试的方案——而不是最后一个。仓库地址https://github.com/alibaba/zvec 官网https://zvec.org「向量数据库界的 SQLite」这个定位之所以贴切——不是因为 Zvec 像 SQLite 那么轻量——是因为它跟 SQLite 一样把重量级数据库的那部分能力装进了一个普通进程能用的库里。欢迎加入我的知识星球全面提升技术能力。加入方式“长按”或“扫描”下方二维码噢星球的内容包括项目实战、面试招聘、源码解析、学习路线。文章有帮助的话在看转发吧。谢谢支持哟 (*^__^*

FAST-LIO激光雷达惯性里程计实战指南：从零构建实时SLAM系统

FAST-LIO激光雷达惯性里程计实战指南：从零构建实时SLAM系统【免费下载链接】FAST_LIO A computationally efficient and robust LiDAR-inertial odometry (LIO) package 项目地址: https://gitcode.com/gh_mirrors/fa/FAST_LIO FAST-LIO作为一款计算高效且鲁…...

2026/5/23 13:56:11 阅读更多 →