DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布! 下午11时 2025/04/04 作者 新智元 发布的研究中,他们发现了奖励模型推理时Scaling的全新方法。 DeepSeek R2,果然近了。
让推理大模型如何思考很重要:回溯DeepSeek-R1中11个数据问题 下午2时 2025/02/09 作者 老刘说NLP 因素,我们可以来看看其中一些关于数据方面的一些问题。 当然,社区也有了一些对应的测试,所以有个讨论,
可视化角度具象化理解DeepSeek-R1类推理大模型的习得进程 下午2时 2025/02/06 作者 老刘说NLP 今天是2025年02月06日,星期四,大年初九,北京,天气晴。 我们来介绍《Visual Guide