超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭 2025年7月22日16时 作者 新智元 MIT研究者发现,测试时训练方法能帮助大模型提升复杂推理问题的准确率。该方法将单个未标记的测试实例转化为自监督学习问题,在对测试样本进行预测之前更新模型参数。