本文是《RAG 技术详解》系列第二篇,聚焦向量索引和检索机制的底层原理与实践。你将深入了解 FAISS、Milvus 等向量库的构建逻辑,掌握 RAG 中 Retriever 的高级配置与优化技巧。
一、向量检索系统的角色定位
在 RAG 中,我们已经将文档转化为若干嵌入向量(embedding)。下一步,系统需要一个机制:
- 快速接收用户 query 的向量表示
- 高效从百万量级文档中找出最相关的前 K 个片段
这个机制就是向量索引(Vector Index)+ 检索器(Retriever)系统。
二、向量索引:语义空间的高速引擎
2.1 什么是向量索引?
向量索引是一种 支持近似最近邻(ANN)搜索的结构,它可将向量空间中的点以某种结构方式组织,提升 Top-K 检索效率。
如果没有索引,逐个比较所有向量是 O(N) 复杂度,代价极高。