DeepSeek R2没来,Kimi K2来了,VLLM,SGLang首发支持
杨植麟提出开源路线,Moonshot AI发布Kimi K2大语言模型,采用混合专家架构,参数量达1万亿,表现出色并在多个基准测试中创造新SOTA记录。核心技术包括MuonClip优化器、大规模Agent数据合成和通用强化学习框架。模型提供两种版本,并通过修改版MIT协议开源。
杨植麟提出开源路线,Moonshot AI发布Kimi K2大语言模型,采用混合专家架构,参数量达1万亿,表现出色并在多个基准测试中创造新SOTA记录。核心技术包括MuonClip优化器、大规模Agent数据合成和通用强化学习框架。模型提供两种版本,并通过修改版MIT协议开源。
Andrej Karpathy 提出PDF格式的论文已不适合AI时代,呼吁使用Git、Markdown等结构化格式重塑科研写作。他认为未来99%的注意力将来自AI,科研成果应为AI优化。Karpathy认为人类读者最好借助AI来提取信息,科学家需要为AI写作。
VeO3 最新更新支持图片生成开口说话的视频,包括声音和动作。用户能上传一张静态图片加上文字脚本,就能生成带有语音同步的视频。Gemini 平台提供了多种选项如首帧转视频、使用 Gemini 和 Flow 生成连贯短片等。
METR研究揭示,即使是顶级程序员在使用AI工具时,代码编写效率也会平均下降19%,且开发者往往无法察觉。该研究强调了开发过程中AI拖慢工作流的问题,提醒人们不要被基准测试的高分所迷惑。
今天是2025年7月12日,星期六,北京有雨。文章介绍了四个代表性大模型训练框架,并使用资源计算器分析了最新万亿参数模型Kimi-K2的运行和微调需求。