Multi-Agent记忆系统MIRIX:比RAG性能飙升35%,存储减少99.9%

尽管AI Agent的记忆能力正受到越来越多的关注,但现有的解决方案本质上仍存在局限性。大多数方案依赖于平面化、狭窄的记忆组件,限制了它们个性化、抽象化以及可靠回忆用户特定信息的能力。
MiRIX对话窗口

为此,提出了MIRIX,这是一个模块化的多智能体记忆系统(Multi-Agent Memory System),通过解决该领域最关键的问题——让语言模型真正具备记忆能力——重新定义了AI记忆的未来。与以往的方法不同,MIRIX突破了文本的限制,融入了丰富的视觉和多模态体验,使记忆在现实场景中真正变得有用。

MIRIX由六种不同的、经过精心设计的记忆类型组成:核心记忆(Core)、情景记忆(Episodic)、语义记忆(Semantic)、程序记忆(Procedural)、资源记忆(Resource Memory)和知识库(Knowledge Vault),并搭配一个多智能体框架,该框架能够动态控制和协调更新与检索。这种设计使智能体能够大规模地持久保存、推理并准确检索多样化、长期的用户数据。
语义记忆:以树状结构展示,例如用户的社交网络、兴趣爱好等
    程序记忆:以列表形式展示,例如用户经常访问的地点、任务步骤等
    MIRIX方法细节:
    • 记忆组件的结构

      • 核心记忆:存储始终对智能体可见的高优先级、持久信息,分为“人格”和“人类”两个模块。

      • 情景记忆:存储时间戳事件和基于时间的交互,类似于结构化的日志或日历。

      • 语义记忆:存储与特定时间或事件无关的抽象知识和事实信息。

      • 程序记忆:存储结构化的、目标导向的过程,如操作流程和交互脚本。

      • 资源记忆:处理用户正在积极参与的文档、转录或多媒体文件。

      • 知识库:作为敏感信息(如凭证、地址、联系信息和API密钥)的安全存储库。

    • 检索设计:MIRIX支持多种检索功能,包括嵌入匹配、BM25匹配和字符串匹配,并正在扩展更多多样化的检索策略。

    • 多智能体工作流:当接收到用户输入时,系统首先在记忆库中进行搜索,然后将检索到的信息和用户输入传递给元记忆管理器,由其分析内容并确定相关记忆组件,将输入路由到相应的记忆管理器进行并行更新。

    首先,在ScreenshotVQA上,这是一个包含近20,000张高分辨率计算机屏幕截图的多模态基准测试,需要深度的上下文理解能力,且现有记忆系统均无法应用。MIRIX在该测试中比RAG基线提高了35%的准确率,同时将存储需求减少了99.9%
    在LOCOMO上,这是一个单模态文本输入的长篇对话基准测试,MIRIX达到了85.4%的最新性能,远远超过了现有的基线。这些结果表明,MIRIX为记忆增强型LLM智能体设定了新的性能标准。
    https://arxiv.org/pdf/2507.07957MIRIX: Multi-Agent Memory System for LLM-Based Agentshttps://github.com/Mirix-AI/MIRIXhttps://mirix.io/

    (文:PaperAgent)

    发表评论