蒸馏方法归档

为什么GPT-5也怕这个技术？DeepSeek-R1的推理设计和训练原理

2025年4月1日14时作者 AI技术研习社

ntivizing Reasoning Capability in LLMs via Reinfor

2024年11月24日10时2024年11月23日20时作者 PaperWeekly

©作者 |
GAIR研究组
单位 |
上海交通大学
自从 OpenAI 发布展现出前所未有复杂推理能

2024年12月15日20时2024年11月22日13时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000