置顶文章
检索、向量与 memory 的边界
最近在思考检索系统、向量数据库和 memory 系统之间的关系。三者都在处理”信息”,但处理方式和目标有本质区别。
检索系统
传统检索的核心是精确匹配。关键词、倒排索引、BM25,返回的是”包含这个词的文档”。这是确定的、可解释的。
优势:精确、可控、可调试 局限:语义理解弱,同义词、上下文依赖
向量检索
向量检索的核心是语义相似性。把文本 embedding 成向量,通过余弦相似度或内积找到”意思相近”的内容。
优势:语义理解强,能处理隐含关系 局限:精确度有限,结果可解释性差
Memory 系统
Memory 的核心是上下文保持和更新。不只是存储,还要管理信息的生命周期、优先级和关联关系。
优势:动态更新、上下文感知 局限:实现复杂,容易陷入”存储幻觉”
边界在哪里
向量检索 ≠ memory。它解决的是”找到相似内容”,不解决”如何组织和使用这些内容”。
但向量检索可以成为 memory 的底层基础设施之一。好的 memory 系统可能需要:
- 传统检索处理精确查询
- 向量检索处理语义匹配
- 额外的逻辑层处理记忆的组织、更新和遗忘
这是一个值得深入的方向。