李飞飞归档 - 第2页共4页

李飞飞、DeepSeek为何偏爱这个国产模型？

2025年2月7日23时作者新智元

阿里云通义千问的Qwen模型在短短时间内取得了显著突破，仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉，取代了Llama成为开源AI社区的重要标杆基座模型。

2025年2月7日14时作者 AI大模型实验室

文章介绍了通过16块H100 GPU在26分钟内训练出低成本语言模型S1K的方法，该模型与OpenAI的o1系列和DeepSeek R1系列性能相当。但实际研究发现，论文核心是基于开源Qwen2.5-32B模型，进行小数据集监督微调，并非直接复制了DeepSeek R1。

2025年2月7日14时作者 AI先锋官

斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型，其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布，并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。

2025年2月7日8时作者量子位

研究团队通过蒸馏技术从阿里通义Qwen2.5-32B-Instruct模型出发，结合Gemini 2.0 Flash Thinking实验版数据集训练出高性能推理模型s1-32B，在数学评测集中表现优异。

2025年1月22日16时作者机器之心

机器之心报道
机器之心编辑部
「语言是人类的语言，而 3D 是自然的语言。」
「除了语言，我们还有另

2025年1月12日8时作者 NLP工程化

论文探讨了Agent AI的全面框架，定义其为能够感知视觉和语言输入并产生具身行为的交互式系统。该框架强调跨现实性、多模态方式以及认知能力，未来可应用于虚拟现实和各类软件产品中。

2024年12月21日20时作者 Z Potentials

李飞飞教授在2024年创立了World Labs公司，并发布了首个基于图像生成3D场景的AI系统。同年，她担任斯坦福大学计算机科学教授、HAI研究院院长，并发表了多场关于空间智能的重要演讲和论文。