Multi-Agent记忆系统MIRIX:比RAG性能飙升35%,存储减少99.9%
尽管现有的AI记忆方案存在局限性,MiRIX提出了多智能体记忆系统MIRIX,突破文本限制融合视觉和多模态体验,并由六种不同类型的记忆组成:核心记忆、情景记忆、语义记忆、程序记忆、资源记忆和知识库。通过动态控制更新与检索的设计,MIRIX在ScreenshotVQA测试中提高了35%的准确率,在LOCOMO对话基准测试中达到了85.4%的新性能。
尽管现有的AI记忆方案存在局限性,MiRIX提出了多智能体记忆系统MIRIX,突破文本限制融合视觉和多模态体验,并由六种不同类型的记忆组成:核心记忆、情景记忆、语义记忆、程序记忆、资源记忆和知识库。通过动态控制更新与检索的设计,MIRIX在ScreenshotVQA测试中提高了35%的准确率,在LOCOMO对话基准测试中达到了85.4%的新性能。
OpenAI支持的研究论文指出,通过监控AI系统的‘思维链’(CoT),可以作为一种强大的工具来监督高级智能系统的行为,特别是当这些系统变得更加复杂和智能时。该研究探讨了如何利用思维链的可读性来检测模型是否表现出不当行为或意图。
近期Google DeepMind的研究人员设计了一种能够根据词的重要性调整计算量的语言模型,通过一个轻量级的‘路由器’决定每个词在共享网络模块中的循环次数,显著提高了模型性能和效率。
AI4Research调查旨在提供一个统一的视角并系统地分类AI在研究中的应用。它分为五个关键领域:科学理解、学术调查、科学发现、学术写作和同行评审。
分析Claude Code v1.0.33的逆向工程研究,包括实时Steering机制、多Agent架构、智能上下文管理和工具执行管道等技术发现,为现代AI代理系统设计和实现提供参考(https://github.com/shareAI-lab/analysis_claude_code)
微软微调出高质量合成数据的Phi-4-mini-Flash-Reasoning 3B模型,采用SambaY解码器架构支持64K上下文长度,提供逻辑密集型任务高性能。
多模态作为AAAI 2025的高频词受到广泛关注。即将召开的AAAI 2026会议上又将产生哪些成果?科研之路艰辛,沃恩智慧提供全方位论文辅导服务,助力学员快速发表高质量SCI论文。
近年来语言模型取得了显著进展,主要得益于从特定任务专用模型转向通用的基于强大架构(如Transformer)模型的学习能力。作者之一Albert Gu提出了一种动态分块机制与层级网络相结合的新技术,能够自动学习内容和上下文相关的切分策略,并实现一个完全端到端训练的模型替代传统的分词→语言模型→反分词流水线。
MCP Toolbox for Databases 是一个开源工具箱,简化数据库开发、管理和安全性的复杂问题,通过集中管理工具和共享智能体与应用程序之间的工具,提高开发效率、性能和安全性。
MemOS是首个为AI系统设计的记忆操作系统,它将记忆统一管理成可调度的资源,并支持三种核心记忆类型:明文、激活和参数。MemOS通过三层架构实现高效存储与检索,显著提高语言模型在多跳推理等任务上的性能。