震惊 AI 界!DeepSeek-R1 :纯RL打造推理王者,AI 自主学习里程碑「技术报告解读」

刚看完《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》论文。该研究证明了仅通过纯强化学习训练的模型,也能媲美甚至超越使用监督微调的数据训练的模型。这一突破展示了无监督学习的巨大潜力,并分享了小型模型通过蒸馏技术获得强大推理能力的方法。

人大、东北大学联合开发「图机器学习库」Jittor Geometric!性能超越PYG、DGL

中国高校图学习开源框架Jittor Geometric发布,展示了在谱域、动态和分子等领域的新进展。该平台支持多种经典图数据集,并且训练速度比现有主流框架快25%。Jittor Geometric提供了统一的模式编写高度统一的数据集和模型,降低了用户的学习成本。未来将通过补充更多前沿模型、优化分布式训练和支持PyTorch转换脚本等功能进一步完善。