推理能力归档 - 第2页共7页

OpenAI o3-pro 全网沸腾！最强AI + o3降到“白菜价”，但是有哪个“槽”你发现了吗？

2025年6月16日14时作者 AI技术研习社

文章介绍了OpenAI最新发布的模型o3-pro及其降价策略，强调了其在推理、科学数据分析、代码编写等方面的强大能力，并讨论了其对AI产业生态可能产生的影响。

张鹏对谈李广密：Agent 的真问题与真机会，究竟藏在哪里？

2025年6月14日11时作者 Founder Park

4o 和 Claude 3.5 接连登场，大模型的边界一次次被重写。但真正让 AI 产业链神经绷紧的

质疑DeepSeek-R1、Claude Thinking根本不会推理！苹果争议论文翻车了？

2025年6月9日23时作者机器之心

nAI o1/o3、Claude 3.7 Sonnet 为代表的推理大模型中得到了验证，它们显示出了

深夜突袭！谷歌Gemini 2.5 Pro更新蝉联榜一：推理超越o3，编程超越opus4

2025年6月6日23时作者机器之心

05）。
在保持 o3 四分之一以下的低价格的同时，在编码（Aider Polyglot）、推理能力

奥特曼：假如给我一千倍算力，我会这样做

2025年6月5日8时作者量子位

奥特曼认为下一代模型将令人惊叹，并指出它们应具备强大的推理能力、处理大量上下文信息的能力以及访问各种工具的特性。他强调了持续快速进步的重要性，而不仅仅是单一的突破。

从打分器到思考者：RM-R1用推理重塑模型价值判断

2025年5月31日23时作者机器之心

言模型的后训练阶段，奖励模型承担着桥接模型行为与人类价值的重要职责；但现有模型往往只给出一个分数，却

Anthropic发布Claude 4：工程师级AI，而不是更聪明的搜索框或对话机器人

2025年5月23日14时作者 AI先锋官

Anthropic联合创始人Dario Amodei在Code with Claude开发者大会上表示，Claude正式进入全链条开发力和标准构建的全新竞争时代。旗舰模型Claude Opus 4延续了推理、代码能力方向，并且表现出色。新功能如‘思维摘要’与‘扩展思维’模式提升用户满意度。API定价及安全级别显著提升，为更多行业提供可靠支持。