谷歌新推理模型重磅来袭:百万上下文,代码执行,推理能力飙升!

木易是互联网技术产品经理,专注于分享AI知识和工具。近期谷歌发布的新模型Gemini-2.0-Flash-Thinking-Exp-01-21,具有100万tokens上下文窗口、原生代码执行等功能,助力提升推理能力和输出长度。这是AI领域内的一个重要进展。

OpenAI之后首个多模态o1发布,这篇技术报告讲清楚了!|

两家企业DeepSeek和Kimi发布推理模型,展示了不同的技术路线。Kimi采用了长上下文扩展、在线镜像下降等策略提升性能,并创新性地提出了Long2Short训练方案。对比其他模型,其在多模态能力和推理精度上表现出色。

以小博大,DeepSeek-R1-Distill-Qwen-1.5B 开源模型击败GPT-4和Claude 3.5!

在数学竞赛AIME测试中,Qwen-1.5B模型以28.9%的成绩击败了GPT-4和Claude 3.5-Sonnet。仅1.5B参数量的它,在MATH测试中取得83.9%成绩。DeepSeek团队采用知识蒸馏技术成功将大模型智慧浓缩进更小的模型,MIT许可下开源多个版本。