PaperWeekly
200多行代码,复旦大学超低成本复现DeepSeek R1「Aha Moment」!
复旦大学知识工场实验室团队基于 GRPO 算法高效复现 R1-zero 自发反思能力,项目代码简洁、依赖简单,资源消耗低。
AVSS 2025征稿启动!第21届IEEE高级视觉与信号系统国际会议
AVSS 2025是IEEE高级视觉与信号系统国际会议的第21届盛会,探讨图像和视频分析中的AI、机器学习算法鲁棒性、隐私性和公平性问题。地点中国台湾台南,时间2025年8月11日-13日,索引SCOPUS,欢迎访问官网了解更多详情。
从ReFT, Kimi K1.5到DeepSeek R1,聊聊Reasoning Model的精巧实现
理模型)异常火爆,Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1,效果追评甚