每时AI - 第1141页共1984页 - 你的AI资讯助手

Light-R1-32B之R1复现认识：兼看R1蒸馏模型所用800K数据细节问题

2025年3月14日14时作者老刘说NLP

今天是2025年3月14日，星期五，北京天气晴。Light-R1-32B复现了R1的效果，但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集；同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。

2025年3月14日14时作者小兵的AI视界

源项目——OpenHands（前身为OpenDevin），
它由All-Hands-AI团队主导开发

2025年3月14日14时作者 AI技术研习社

加速法：告别拖延，秒做完炫酷PPT！
【AI职场教程】一键美化PPT！DeepSeek+WPS，工作

2025年3月14日14时作者 IT桔子

桔子（itjuzi521），侵权必究。
3、建立“投资速递”长期发布合作，
请发邮件到 hello

2025年3月14日14时作者 GiantPandaCV

dation Classification
论文地址：
https://openreview.net