即使2025年了，RAG也不会被淘汰

RAG（检索增强生成）自从第一个大上下文窗口的LLM（大语言模型）发布以来，就逐渐式微。

一些值得注意的“RAG死亡”时刻包括：

现实是这样的：

即使拥有令人印象深刻的 2M token 上下文窗口，目前的长上下文 LLM 仍然只能处理简单数据集。

例如，一个 1M token的上下文窗口大致相当于 1500 页文档。

对于演示来说很不错，但对于生产级应用来说仍然不足。

但假设我们拥有一个上下文窗口，支持无限的tokens：

结论：你需要长上下文 LLM 和 RAG。

但由于“RAG”这个术语似乎如此具有争议，我们可以这样说：我们不必称之为 RAG。我们可以称其为简单的检索，或者是上下文策划。

无论你决定称之为何，能够控制输入上下文窗口的数据质量，将决定生成输出的质量。

毕竟，garbage in, garbage out（垃圾进，垃圾出）。

（文：PyTorch研习社）