暗流涌动!DeepSeek 开源 DeepSeek-V3-Base 硬刚 Claude 3.5

DeepSeek AI 发布全新开源大模型 DeepSeek-V3-Base,完成率提升48.4%,在多语言编程领域超越Claude 3.5 Sonnet。该模型拥有256位顶尖专家的智库架构,通过MoE混合专家实现「专才专用」,支持上下文长度最高可达8K。

一招将模型推理能力暴拉12%,开源版o3 指日可待?!

一位研究人员利用周末时间将谷歌PaliGemma2-3B-448px模型性能提升了18%,展示了小型化AI模型的强大潜力。该研究通过使用Gemini 2.0 Flash Thinking的能力,增强了基础模型在识别和推理任务中的表现。

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

Google DeepMind联合研究者发现不同模型组的智能体在游戏中表现出不同的合作倾向。Claude与Sonnet偏好合作,而GPT-4o则倾向于自私。实验通过引入惩罚机制来探索模型的合作行为影响。

见证历史!AI想的科研idea,真被人类写成论文发表了

AI提出的想法被人类写成论文。一篇关于神经网络中的最小描述长度与’grokking’现象关系的研究,揭示了训练过程中模型复杂性的动态变化,并提出了基于失真压缩的新方法来衡量神经网络的复杂性。