微软DeepSpeed 归档

打破思维链推理瓶颈！“软推理”让大模型学会人类抽象能力，token使用量还更少了

2025年5月24日16时作者量子位

研究提出Soft Thinking方法，让模型在连续的概念空间中进行“软推理”，打破基于离散token的推理瓶颈。相比标准CoT，最高提升Pass@1平均准确率2.48%，减少token使用量22.4%。