模仿、探索与自我提升:慢思考推理系统的复现之路 2024年12月16日14时 作者 PaperWeekly ©作者 | 蒋锦昊,陈志朋,闵映乾 单位 | 中国人民大学 研究方向 | 大语言模型与推荐系统 近年