ICML 2025 Transformer还有救?魔改残差连接,MUDDFormer硬刚超深网络 2025年7月21日16时 作者 PaperWeekly 不太可能了。 但是总有人愿意打破常规,最近一篇 ICML 2025 的论文,又让 Transform
面壁“小钢炮”登上Nature子刊,8B多模态综合性能超越GPT-4V、Gemini Pro 2025年7月18日16时 作者 PaperWeekly 》正式刊登了来自清华、面壁等研究团队联合研发的高效端侧多模态大模型 MiniCPM-V 核心研究成果
语料一变就崩?EraRAG首创“增量语义图”,动态语料场景下也能稳准快 2025年7月16日12时 作者 PaperWeekly 多跳推理与深层理解的关键路径。 然而,现有的 Graph-RAG 方法普遍建立在静态语料假设之上,一
SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化 2025年6月8日8时 作者 PaperWeekly nguage Models 论文链接: https://arxiv.org/abs/2505.006
近千篇文献淬炼!哈工大领衔发布首篇长思维链综述:重构大模型推理能力边界 2025年6月6日16时 作者 PaperWeekly 务中屡创佳绩,但真正推动它们迈入智能进化新阶段的,是一种更具层次性的推理方式: 长思维链(Long
越用越聪明or越学越崩?首个终身学习Agent基准来了,全面评估智能体进化潜能 2025年6月5日11时 作者 PaperWeekly 说,在面对环境中的持续新任务与知识时,是否能够有效学习、适应、保留过去经验、并防止遗忘? 本文介绍了
社交直男逆袭!通义AMPO炼成“多面脑回路”智能体,自适应推理秒切4种人格 2025年5月26日16时 作者 PaperWeekly 是如何炼成的? 最近,通义实验室的最新研究工作让 AI 智能体掌握了人类高深的社交艺术:四种思考模式
告别生成偏差!快手Any2Caption智能解耦意图理解,实现可控视频生成 2025年5月21日16时 作者 PaperWeekly 的视频?这个梦想,已经成为现实! 快手与新加坡国立大学联合推出的 Any2Caption,打破了多模
ICLR 2025 差分注意力机制爆火!DIFF Transformer击穿长文本建模天花板 2025年4月30日16时 作者 PaperWeekly 建模能力为语言理解与生成带来了前所未有的突破。 然而,随着模型规模的不断扩大和应用场景的日益复杂,传
打破共识优化壁垒!华南理工深耕分布式进化计算,实现多智能体高效协同 2025年4月22日23时 作者 PaperWeekly tems, MAS)作为新一代智能协同的技术基础,正迎来前所未有的发展机遇。 在这些系统中,多个具备