本地LLM万字救场指南来了!全网超全AI实测:4卡狂飙70B大模型 2025年7月3日16时 作者 新智元 2B卡不卡?70B是不是智商税?要几张卡才能撑住业务? 全网最全指南教你如何用最合适的配置,跑出最强
逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse 2025年6月17日23时 作者 机器之心 CMU Infini-Al-Lab 研究人员提出 Multiverse,一种支持原生并行生成的新型生成模型框架,显著提高大语言模型的推理效率和速度。
DeepSeek-R1发布后的100天复现之旅方法总结 2025年5月3日14时 作者 机器学习算法与自然语言处理 MLNLP社区发布论文介绍复现推理大模型技术,强调让AI学会思考而非仅背答案;提出监督微调与强化学习两大方法,并讨论未来发展方向。