Multi-Agent记忆系统MIRIX:比RAG性能飙升35%,存储减少99.9%

尽管现有的AI记忆方案存在局限性,MiRIX提出了多智能体记忆系统MIRIX,突破文本限制融合视觉和多模态体验,并由六种不同类型的记忆组成:核心记忆、情景记忆、语义记忆、程序记忆、资源记忆和知识库。通过动态控制更新与检索的设计,MIRIX在ScreenshotVQA测试中提高了35%的准确率,在LOCOMO对话基准测试中达到了85.4%的新性能。

多模态推理新思路:D2I框架如何让模型“深思熟虑”又“直觉敏锐”?

本文介绍了一种名为 Deliberate-to-Intuitive (D2I) 的推理框架,旨在提升多模态大型语言模型(MLLMs)在复杂推理任务中的表现。通过在训练阶段采用深度推理策略,并在测试阶段允许模型自由生成答案,显著提升了多模态模型的推理能力,同时保持了训练的高效性和可扩展性。

技术总结之RAG用于文档信息抽取及多模态大模型两阶段训练范式

2025年7月9日,北京晴天。文章总结了SIGIR 2025 LiveRAG竞赛的评测报告,并介绍了信息抽取和多模态大模型训练的相关方案。强调在轮子同质化背景下,业务know-how的重要性,指出文档解析、RAG及大模型应用出现同质化严重现象。同时提到了两个大模型训练指引资源。