32B模型归档 - 每时AI

本地LLM万字救场指南来了！全网超全AI实测：4卡狂飙70B大模型

2025年7月3日16时作者新智元

2B卡不卡？70B是不是智商税？要几张卡才能撑住业务？全网最全指南教你如何用最合适的配置，跑出最强

2025年6月17日23时作者机器之心

CMU Infini-Al-Lab 研究人员提出 Multiverse，一种支持原生并行生成的新型生成模型框架，显著提高大语言模型的推理效率和速度。

MLNLP社区发布论文介绍复现推理大模型技术，强调让AI学会思考而非仅背答案；提出监督微调与强化学习两大方法，并讨论未来发展方向。