超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
DeepSeek-R1 在 ARC-AGI 上的表现不及 OpenAI 的 o3 系列模型,但通过 SnakeBench 对抗性基准测试,在 1v1 贪吃蛇比赛中击败了 o1-mini,并接近 o3-mini。
DeepSeek-R1 在 ARC-AGI 上的表现不及 OpenAI 的 o3 系列模型,但通过 SnakeBench 对抗性基准测试,在 1v1 贪吃蛇比赛中击败了 o1-mini,并接近 o3-mini。
上周有学习者希望学习多模态大模型的部署与微调,Datawhale妙妙屋提供教程开源地址。同时,Qwen2.5-Coder因朋友圈刷屏引发热议,并开源了相关教程。