Denny
置顶文章

检索、向量与 memory 的边界

· 1 分钟阅读 ·

最近在思考检索系统、向量数据库和 memory 系统之间的关系。三者都在处理”信息”,但处理方式和目标有本质区别。

检索系统

传统检索的核心是精确匹配。关键词、倒排索引、BM25,返回的是”包含这个词的文档”。这是确定的、可解释的。

优势:精确、可控、可调试 局限:语义理解弱,同义词、上下文依赖

向量检索

向量检索的核心是语义相似性。把文本 embedding 成向量,通过余弦相似度或内积找到”意思相近”的内容。

优势:语义理解强,能处理隐含关系 局限:精确度有限,结果可解释性差

Memory 系统

Memory 的核心是上下文保持和更新。不只是存储,还要管理信息的生命周期、优先级和关联关系。

优势:动态更新、上下文感知 局限:实现复杂,容易陷入”存储幻觉”

边界在哪里

向量检索 ≠ memory。它解决的是”找到相似内容”,不解决”如何组织和使用这些内容”。

但向量检索可以成为 memory 的底层基础设施之一。好的 memory 系统可能需要:

  1. 传统检索处理精确查询
  2. 向量检索处理语义匹配
  3. 额外的逻辑层处理记忆的组织、更新和遗忘

这是一个值得深入的方向。