学术
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转
本文介绍了一篇CVPR 2025 Highlight论文《CrossFlow》及其相关工作,该研究提出了一个新的跨模态生成框架,并在多个任务上取得了媲美甚至超越最优算法的性能。
英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限
NVIDIA团队提出ProRL框架,在2000步以上长期强化学习基础上,大幅提升大语言模型的推理能力。ProRL训练后模型在逻辑谜题等任务中表现出显著进步,不仅提高了解题准确率,还能生成新解法。研究揭示了长期RL训练的重要性及其对模型边界扩展的影响。