最佳策略归档

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

2024年12月17日14时作者量子位

Hugging Face团队利用Llama 1B模型在数学测试中超过8倍大模型的性能，并改进了搜索策略以提升模型表现。研究涉及多种方法，最终发现DVTS方法能显著提高简单/中等难度问题的性能。