推理能力
先别急着给OpenAI加冕!陶哲轩:这种「金牌」,含金量取决于「赛制」
OpenAI 模型在国际数学奥林匹克竞赛中取得佳绩,得分为35分(满分42分),引发广泛讨论。陶哲轩认为需谨慎看待此类结果,强调测试条件的重要性。
18个Deepresearch项目技术实现对比及RAG与Reasoning结合范式
2025年7月15日文章概述:探讨RAG与Reasoning结合的必要性和实现方案,并对比分析了18个DeepResearch项目的技术细节。
微软推出深度视频探索智能体,登顶多个长视频理解基准
论文提出 Deep Video Discovery (DVD),通过将长视频分割成多粒度片段并利用LLM推理能力自主规划工具获取信息来回答问题。在最新的推理模型OpenAI o3帮助下,DVI以74.2%准确率超越现有工作,在LVBench上大幅领先。