OpenAI o3-mini:用小模型改写AI推理规则的「科学狂人」

OpenAI发布的o3-mini模型实现了GPT-4级别的STEM能力,数学竞赛准确率达83.6%,推理速度提升24%。这款高性价比模型支持三档动态算力调节,并且首次向免费用户开放。

AI大神Andrej Karpathy的通俗解释:预训练、监督式微调、强化学习!

AI 大神 Andrej Karpathy 比喻训练大型语言模型 (LLM) 的过程就像教育学生,以教科书的结构阐述了当前 LLM 训练现状和未来方向。他将预训练、监督式微调和强化学习分别比作背景信息、例题及解答和练习题,强调需要更多的实践来提升 LLM 能力。

突发!人形机器人Figure宣布与OpenAI终止合作!

AI 机器人公司 Figure 宣布终止与 OpenAI 的合作协议,转而自主研发端到端机器人 AI。Figure 表示将在未来展示突破性技术,并发布使用 OpenAI 模型进行对话的视频。合作突然结束的原因尚不清楚,但可能与 OpenAI 更注重软件而非硬件有关。

OpenAI Deep Research被huggingface 24小时复现开源了,冲~

本文介绍了多个OpenAI Deep Research的复现项目,并重点介绍Hugging Face的open-Deep-Research项目,它在GAIA基准测试中的准确率达到了54%。强调了使用代码表达操作的优势以及未来改进的方向,如扩展文件格式数量、提出更细粒度的文件处理等。

传言称Grok-3延迟!但马斯克仍手握最强算力

Grok-3因不符合要求而推迟发布,马斯克在AI竞赛中通过超强算力改写游戏规则。超级计算中心拥有20万块GPU,为了支持它建造了自己的天然气发电厂、部署了特斯拉电池以及安装了制冷系统。关于Grok-3的推理能力改进,工程师们正在添加新的功能以使其更强。不过也有质疑的声音认为拥有最多GPU并不意味着能做出最好的模型。