最优学习率归档 - 每时AI

别再卷数据了，LLM也怕「过劳死」！CMU等揭秘灾难性过度训练

2025年5月3日16时作者新智元

难调！CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。
如果训练数据越多那么LLM越好。

阶跃星辰开源LLM最优超参工具

2025年3月15日8时作者 NLP工程化

研究团队通过大规模训练和超参数优化发现了大语言模型的最优学习率与数据规模呈幂律变化的缩放法则。