月度归档: 2025 年 5 月
DeepSeek节前又双叒叕搞事,R1“小版本试更新”代码能力实测堪比Claude 4
DeepSeek官方近日宣布已完成DeepSeek R1模型的小版本试升级,并在HuggingFace上开源了新版本。该模型在代码生成方面提升显著,性能接近OpenAI的模型且超越Claude-4-Sonnet,但推理能力稍有不足。
Llama核心团队大面积跑路:14人中11人出走,Mistral成主要去向!
Meta AI 团队面临严重人才流失问题,Llama 模型核心研究成员离职率高。Meta 在开源领域与竞争对手差距明显,导致 Llama 模型在开发者社区反响平平。
刚刚,新版DeepSeek-R1正式开源!
新版DeepSeek-R1开源,编码能力、推理能力和思考时间显著提升。支持长时思考且编程能力强到爆。与Gemini 2.5 Pro对标,表现不俗。多项实测展示其强大功能。
实测思维链大变!DeepSeek R1一个“小升级”性能直逼o3,但仍“过度思考”?
DeepSeek 在 Huggingface 平台开源新版本 DeepSeek-R1-0528,主要提升推理精度和代码生成速度。
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
UC Berkeley团队提出的新方法Intuitor通过优化模型自身的置信程度来提升大模型的复杂推理能力,无需外部奖励信号或标准答案。与传统强化学习相比,Intuitor能有效减少无效响应并提高模型在数学和代码生成任务中的表现。