置顶文章

检索、向量与 memory 的边界

2024年2月20日 · 1 分钟阅读 ·

最近在思考检索系统、向量数据库和 memory 系统之间的关系。三者都在处理”信息”，但处理方式和目标有本质区别。

检索系统

传统检索的核心是精确匹配。关键词、倒排索引、BM25，返回的是”包含这个词的文档”。这是确定的、可解释的。

优势：精确、可控、可调试局限：语义理解弱，同义词、上下文依赖

向量检索的核心是语义相似性。把文本 embedding 成向量，通过余弦相似度或内积找到”意思相近”的内容。

优势：语义理解强，能处理隐含关系局限：精确度有限，结果可解释性差

Memory 的核心是上下文保持和更新。不只是存储，还要管理信息的生命周期、优先级和关联关系。

优势：动态更新、上下文感知局限：实现复杂，容易陷入”存储幻觉”

向量检索 ≠ memory。它解决的是”找到相似内容”，不解决”如何组织和使用这些内容”。

但向量检索可以成为 memory 的底层基础设施之一。好的 memory 系统可能需要：

这是一个值得深入的方向。