GPT-5涌现能力可预测?UC伯克利仅使用当前模型检查点预测未来模型

LLM 规模扩展面临挑战,加州大学伯克利分校团队提出预测涌现能力的任务,并通过拟合参数函数——’涌现定律’来验证和提前准确预测涌现点。研究使用四个标准 NLP 基准进行验证。

陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流

一个刚发布两天的开源模型QwQ在AI数学奥林匹克竞赛AIMO上创造了新纪录,其表现甚至比之前的开源模型更好。QwQ系列大模型,特别是QwQ-32B,在科学推理能力方面表现出研究生水平,并在多个评测中取得了高分。

多模态慢思考:分解原子步骤以解决复杂数学推理

AtomThink 是一个全流程框架,通过改进多模态大语言模型的原子推理步骤质量来解决复杂的数学推理问题。它发布了一个高质量的长链式思考数据集,并引入了慢思考策略提高了各种数学任务的推理性能。

流式深度学习终于奏效了!强化学习之父Richard Sutton力荐

本文提出了一种名为 stream-x 的深度强化学习算法,用于解决流式障碍问题。该方法无需使用重放缓冲区、批量更新或目标网络,即可从最新的经验中进行学习,并且在样本效率上可与批量强化学习相当。

斯坦福吴佳俊扩散自蒸馏来了!突破文生图身份保留挑战

斯坦福大学的研究提出了一种名为扩散自蒸馏(Diffusion Self-Distillation)的方法,该方法通过简单扩展普通扩散 transformer 模型为图像条件扩散模型来实现主体适应性和概念一致性。实验表明,其在概念保留和提示跟随方面都取得了最佳的整体性能。