机器之心，作者每时AI - 第29页共134页

ICML 2025 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

2025年6月8日23时作者机器之心

的高效上下文建模。在 128K 超长序列上下文建模任务中，CCA-Attention 的推理速度是标

2025年6月8日23时作者机器之心

Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效

2025年6月8日16时作者机器之心

该项目由北京邮电大学白婷副教授指导，旨在解决大语言模型在长期对话中记忆断裂的问题。MemoryOS 是首个结合操作系统原理与人脑分层机制的大模型记忆管理系统，显著提升了AI的上下文连贯性和个性化记忆能力。

2025年6月8日16时作者机器之心

本文研究了语言模型对强化学习中奖励噪声的鲁棒性，即使翻转大部分奖励也能保持高下游任务表现。作者提出了思考模式奖励机制，并展示了其在数学和AI帮助性回复生成任务中的有效性。

2025年6月8日16时作者机器之心

学家费马在书页边缘留下了一个看似简单却困扰了学者几个世纪的难题——费马大定理。
1994 年，And

2025年6月8日11时作者机器之心

本文研究了大语言模型在代码推荐中对特定服务供应商的偏好问题，揭示了供应商偏见可能导致的安全后果，并提出了一些建议。

2025年6月8日11时作者机器之心

本周解读了Diffusion LLM和AI推理成本相关话题。Gemini Diffusion因其扩散架构被社区热议，其生成效率高且并行高效机制让其有潜力成为自回归模型的新挑战者；同时，AI开发者们也关注到基于扩散模型的NLP任务潜力及其与传统建模方式的关系。

2025年6月8日8时作者机器之心

本文介绍的工作基于先前发布的8B扩散语言模型LLaDA，提出了方差缩减的偏好优化方法VRPO，并利用VRPO对LLaDA进行了强化对齐，推出了LLaDA 1.5。该模型在数学、代码和对齐任务上取得了提升，具有竞争力优势。

2025年6月8日8时作者机器之心

研大模型。
该模型名为 dots.llm1，是小红书 hi lab（Humane Intellige

2025年6月8日8时作者机器之心

们的产品到底什么时候在国内上线？」最近，爱诗科技也体验了一把小说作者的待遇 —— 打开后台，发现私