研究发现归档 - 每时AI

百万美金炼出「调参秘籍」！阶跃星辰开源LLM最优超参工具

2025年3月13日16时作者机器之心

DIA H800 GPU 小时（约百万美元），从头训练了 3,700 个不同规模，共计训了 100

大模型不会推理，为什么也能有思路？有人把原理搞明白了

2024年12月15日20时2024年11月22日13时作者机器之心

机器之心报道
编辑：泽南、杜伟
大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」