1B参数量归档 - 每时AI

超越Claude 3.5和o1！8B模型靠「分层投票+测试时训练」逆袭

2025年7月22日16时作者新智元

MIT研究者发现，测试时训练方法能帮助大模型提升复杂推理问题的准确率。该方法将单个未标记的测试实例转化为自监督学习问题，在对测试样本进行预测之前更新模型参数。