并行扩展方法归档 - 每时AI

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

2025年2月6日16时作者新智元

新智元报道
编辑：犀牛
【新智元导读】
大模型推理性能的提升，真的只能靠堆数据、加算力吗？李飞飞等用