推理时扩展归档

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

2025年4月5日16时作者量子位

DeepSeek发布新论文提出SPCT方法解决通用RM推理时扩展问题，并计划先发布o3和o4-mini，GPT-5将在几个月后推出。

2025年4月4日23时作者新智元

发布的研究中，他们发现了奖励模型推理时Scaling的全新方法。
DeepSeek R2，果然近了。

2025年2月15日16时作者新智元

英伟达利用DeepSeek-R1和推理时扩展技术自动化生成GPU内核，大幅提升AI模型的注意力机制性能。