AIME数学竞赛
训练200万小时!OpenAI刚刚开源GPT-oss,AI Agent专属模型、可商用
OpenAI开源了GPT-oss模型,支持1200亿和200亿参数量的两种版本。120B版需要80GB GPU运行,20B版则只需16GB GPU即可使用。该模型具有函数调用、网络搜索等高级功能,且性能与OpenAI前沿模型相媲美。
Magistral发布:用纯RL打造出首个多语言、透明Reasoning大模型!
MLNLP社区介绍其致力于促进国内外自然语言处理领域的交流合作,Magistral通过纯强化学习训练提高解题能力,成果包括在AIME数学竞赛上的显著提升,在多种场景下的表现及未来研究方向的探索。
OpenAI o3-mini:用小模型改写AI推理规则的「科学狂人」
OpenAI发布的o3-mini模型实现了GPT-4级别的STEM能力,数学竞赛准确率达83.6%,推理速度提升24%。这款高性价比模型支持三档动态算力调节,并且首次向免费用户开放。
以小博大,DeepSeek-R1-Distill-Qwen-1.5B 开源模型击败GPT-4和Claude 3.5!
在数学竞赛AIME测试中,Qwen-1.5B模型以28.9%的成绩击败了GPT-4和Claude 3.5-Sonnet。仅1.5B参数量的它,在MATH测试中取得83.9%成绩。DeepSeek团队采用知识蒸馏技术成功将大模型智慧浓缩进更小的模型,MIT许可下开源多个版本。