推理能力归档

奥特曼：ChatGPT只是意外，全能AI智能体才是真爱！Karpathy：7年前就想到了

2025年8月4日23时作者新智元

曾不起眼的小组，却在通过攻克数学难题，秘密锻造其真正的核心武器：「推理」能力，也就是终极目标「AI智

2025年7月26日23时作者多知

OpenAI将发布GPT-5模型，奥尔特曼在X上透露该模型即将推出mini和nano版本，并通过API开放给外部使用。

2025年7月20日12时作者机器之心

OpenAI 模型在国际数学奥林匹克竞赛中取得佳绩，得分为35分（满分42分），引发广泛讨论。陶哲轩认为需谨慎看待此类结果，强调测试条件的重要性。

2025年7月15日14时作者老刘说NLP

2025年7月15日文章概述：探讨RAG与Reasoning结合的必要性和实现方案，并对比分析了18个DeepResearch项目的技术细节。

2025年7月10日16时作者智东西

日，马斯克的AI公司xAI发布其最新旗舰大模型
Grok 4
和多智能体版本
Grok 4 Heav

2025年7月3日16时作者 APPSO

马斯克团队为即将发布的Grok 4和编程模型Grok 4 Code进行加班，新增多模态输入、强大推理能力等新功能。

2025年6月30日16时作者机器之心

论文提出 Deep Video Discovery (DVD)，通过将长视频分割成多粒度片段并利用LLM推理能力自主规划工具获取信息来回答问题。在最新的推理模型OpenAI o3帮助下，DVI以74.2%准确率超越现有工作，在LVBench上大幅领先。

2025年6月26日8时作者 NLP工程化

Sakana AI提出的新方法RLT让7B模型训练出的学生超过671B模型，且成本仅为传统方法的1/3。

2025年6月23日16时作者 Z Potentials

AI生态系统总收入与已投入的资金相比仍然相形见绌。然而，在算力日益充裕的世界里，人才优势变得更为关键。

2025年6月19日8时作者机器之心

s（如 GPT-4、Claude、Gemini 等）在代码生成领域取得了显著进展。它们不仅在经典编程