从文心开源谈起,论大模型发展新生态
百度正式开源文心 4.5 系列模型,包括 MoE 和稠密模型,覆盖多种参数规模。这是国内首个大规模预训练权重 + 推理代码完全开源的大模型系列,标志着百度在多模态理解和开放生态上的全面进化。
百度正式开源文心 4.5 系列模型,包括 MoE 和稠密模型,覆盖多种参数规模。这是国内首个大规模预训练权重 + 推理代码完全开源的大模型系列,标志着百度在多模态理解和开放生态上的全面进化。
Magenta RealTime 是一个开源音乐生成模型,由 Google 开发,能够在资源有限的环境中部署。它基于 SoundStream RVQ 编解码器和 MusicCoCa 模型工作原理。
Sam Altman 在旧金山与YC CEO对话中分享了关于OpenAI的未来、AGI愿景以及下一代技术浪潮的观点。他透露即将发布一个远超预期的开源模型,并且明确指出了GPT-5及多模态超级模型的发展方向,强调不要复制ChatGPT而是创造真正缺失的东西。
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。
MiniMax举办开源周活动,正式发布最新推理模型MiniMax-M1,支持100万token输入与8万token输出,参数量达4560亿。通过大规模强化学习训练,仅耗资53.47万美元。该模型采用混合注意力架构和闪电注意力机制,显著提升推理效率,并在复杂任务中表现突出。
DeepSeek 更新其R1推理模型至0528版本,提升性能并参加LMArena大模型公共基准测试平台的排行榜,DeepSeek-R1(0528)在文本、编程、数学等多个领域排名领先。
复旦大学及香港中文大学MMLab联合上海人工智能实验室等多家单位提出了MME-Reasoning,全面评估多模态大模型的推理能力。该基准分为三类推理:演绎、归纳和溯因,并涵盖三种问题类型。评测结果显示当前最优模型得分仅60%左右,显示了对逻辑推理能力的要求极高。