量子位
OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票
OpenAI宣布将征集下一个开源项目。网友猜测是否会在GPT-4.5和未来几个月的GPT-5上实现开源,并对奥特曼此前拒绝开源的行为表示疑惑。
DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题
国产AI几何模型TongGeometry能解决IMO-AG-30题中的所有30题,以及IMO-AG-50上的42题,并达到人类金牌选手平均水平。它使用策略网络和价值网络联合Beam Search进行解题,性能远超谷歌AlphaGeometry,仅需32个CPU核心和1块4090就能实现满血解题。
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
利用300多万个实例将代码转换成思考过程构建数据集CODEI/O,提升Qwen、Llama等模型推理能力,覆盖常识、数学、代码、物理、工程等多个领域。
Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
GPT-4o最新版本发布,不仅在多项任务上超越DeepSeek-R1并列第一,还展现出更个性化、拟人化的回复风格,并且透露了更多用户心理洞察。同时,在某些特定问题上表现出自信和独立判断能力。
不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限
上海AI Lab提出的新方法OREAL利用基于结果奖励的强化学习超越了DeepSeek,无需超大规模模型蒸馏。通过模仿正样本、偏好负样本并关注关键步骤,实现了数学推理任务上的显著提升,并开源训练数据和模型以促进研究对比。