Qwen-2.5-3B 归档 - 每时AI

R1复现基座选用Qwen or Llama？兼看Audio-Reasoner多模态语音推理思路

2025年3月7日14时作者老刘说NLP

在2025年3月7日的周五，文章探讨了AI内容的影响范围及R1复现基座的一些解释，并介绍了多模态语音大模型在R1方面的尝试。

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

2025年2月7日16时作者机器之心

有时对模型性能的助益不大。
在过去这半个月里，关于 DeepSeek 的一切都会迅速成为焦点。
一项