分享归档 - 第308页共398页

OpenAI o3-mini：用小模型改写AI推理规则的「科学狂人」

2025年2月5日14时作者子非AI

OpenAI发布的o3-mini模型实现了GPT-4级别的STEM能力，数学竞赛准确率达83.6%，推理速度提升24%。这款高性价比模型支持三档动态算力调节，并且首次向免费用户开放。

分类分享标签 7ms、 83.6%、 98.7%、 AIME数学竞赛、 O3-mini、 OpenAI、万亿参数级、函数调用、多模态推理、恶意指令拦截率、极速响应、模型成本降低、生产力工具、越狱攻击防御发表评论

AI大神Andrej Karpathy的通俗解释：预训练、监督式微调、强化学习！

2025年2月5日14时作者 Datawhale

AI 大神 Andrej Karpathy 比喻训练大型语言模型 (LLM) 的过程就像教育学生，以教科书的结构阐述了当前 LLM 训练现状和未来方向。他将预训练、监督式微调和强化学习分别比作背景信息、例题及解答和练习题，强调需要更多的实践来提升 LLM 能力。

分类分享标签 Karpathy、强化学习、监督式微调、背景知识、预训练、高质量输出发表评论

突发！人形机器人Figure宣布与OpenAI终止合作！

2025年2月5日14时作者 Datawhale

AI 机器人公司 Figure 宣布终止与 OpenAI 的合作协议，转而自主研发端到端机器人 AI。Figure 表示将在未来展示突破性技术，并发布使用 OpenAI 模型进行对话的视频。合作突然结束的原因尚不清楚，但可能与 OpenAI 更注重软件而非硬件有关。

分类分享标签 Brett Adcock、 Figure、 OpenAI、专用AI模型集成、分歧、端到端机器人AI技术发表评论

一招教你解决DeepSeek R1的卡顿问题。

2025年2月5日14时作者数字生命卡兹克

DeepSeek官方服务体验不佳，用户寻求第三方替代方案。硅基流动和Chatbox AI结合使用提供稳定且友好的接口访问DeepSeek模型。教程简单易懂，适合小白用户。

分类分享标签 671B参数量、 Chatbox AI、 DeepSeek R1、卡兹克、硅基流动、第三方API调用服务发表评论

PyCharm接入DeepSeek实现AI编程

2025年2月5日14时作者 Datawhale

通过PyCharm接入DeepSeek实现AI辅助编程，包含创建API Key、配置Continue插件等步骤，并演示了效果验证。

分类分享标签 671B、 AI代码提示、 API Key、 Continue插件、 DeepSeek、 PyCharm 发表评论

OpenAI Deep Research被huggingface 24小时复现开源了，冲~

2025年2月5日14时作者 PaperAgent

本文介绍了多个OpenAI Deep Research的复现项目，并重点介绍Hugging Face的open-Deep-Research项目，它在GAIA基准测试中的准确率达到了54%。强调了使用代码表达操作的优势以及未来改进的方向，如扩展文件格式数量、提出更细粒度的文件处理等。

分类分享标签 30%、 54%、 GAIA基准测试、 open-Deep-Research、 PaperAgent、智能Agent技术发表评论

造梦师手记：斯拉夫人的浪漫与美貌

2025年2月5日12时作者路过银河AI

XHS涌入大量的外国人后，中国人发现，虽然都是金发碧眼，但不同的国家和地区，还是有明显的区别的。
最

分类分享、大模型标签下雪街头、军装照、年轻女性模特、水中模特、蒸汽朋克酒馆、证件照片 1 条评论

传言称Grok-3延迟！但马斯克仍手握最强算力

2025年2月5日12时作者 AGI Hunt

Grok-3因不符合要求而推迟发布，马斯克在AI竞赛中通过超强算力改写游戏规则。超级计算中心拥有20万块GPU，为了支持它建造了自己的天然气发电厂、部署了特斯拉电池以及安装了制冷系统。关于Grok-3的推理能力改进，工程师们正在添加新的功能以使其更强。不过也有质疑的声音认为拥有最多GPU并不意味着能做出最好的模型。