PaperAgent
OpenAI与Anthropic秘密开启了递归自我改进行动~
OpenAI和Anthropic秘密开启了递归自我改进行动。OpenAI可能开发了GPT-5但选择内部保留;Anthropic的Claude Opus 3.5未发布或用于生成训练数据。专家认为未来O4/O5将能自动化研发。
像人一样学会记忆,谷歌新架构Titans打破Transformer上下文限制
Google提出Titans架构通过引入长期记忆模块增强模型处理长序列数据的能力,超越现有模型如GPT-4、Llama3.1-70B等,并结合适应性遗忘机制和门控遗忘来管理有限的记忆资源。
OpenAI Agent已来,Multi-Agent协作是未来
随着Agentic AI和OpenAI Agent应用的增多,多智能体协作系统(MASs)正朝着多个基于大型语言模型(LLMs)的智能体方向发展。未来的研究将聚焦于如何通过协作机制实现有效、高效的任务解决。
MiniCPM-o 2.6:视觉、语音和多模态流式能力达到了GPT-4o级别
MiniCPM-o 2.6 是性能最佳的多模态大模型之一,支持视觉、语音和多模态流式能力达到GPT-4级别,并新增了可配置声音功能及情感/语速/风格控制等新特性。
Mistral发布Codestral 25.01,Copilot榜单的王~
Codestral 25.01 正式发布,优化了80多种编程语言支持,并在 LMsys Copilot 排行榜中排名第一(并列)。
MiniRAG:一个极致简洁、高效的新型RAG系统
香港大学提出MiniRAG,一种专为极简和高效设计的新型RAG系统,解决SLMs在语义理解和文本处理上的局限性。通过引入语义感知的异构图索引机制和轻量级拓扑增强检索方法,MiniRAG在使用SLMs时与基于LLM的方法性能相当,同时节省25%存储空间。
AMD发布科研Agent,论文自动化评分趋近顶会NeurIPS水平~
AMD推出的Agent Laboratory利用自主大型语言模型支持科学发现流程,通过文献综述、实验和报告撰写三个阶段生成研究报告和代码仓库,显著提高研究质量和效率并降低成本。
o1再升级!人大&清华提出Search-o1:赋予推理模型主动搜索的能力
本文提出了一种新的推理框架Search-o1,通过自主知识检索和文档内推理模块提高了大型推理模型的知识获取能力,显著提升了其在复杂任务中的表现,并展示了其在解决知识不足问题上的潜力。