超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭 2025年7月22日16时 作者 新智元 MIT研究者发现,测试时训练方法能帮助大模型提升复杂推理问题的准确率。该方法将单个未标记的测试实例转化为自监督学习问题,在对测试样本进行预测之前更新模型参数。
Karpathy 3 小时深度揭秘 ChatGPT 的“大脑”,盛赞DeepSeek重新激发RL 2025年2月6日16时 作者 AI寒武纪 人工智能大神Andrej Karpathy 全新视频发布:时长 3 小时 31 分钟的深度解析 –