5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

谷歌Deep Research搭载Gemini 2.5 Pro模型升级,显著提升分析、推理和报告生成能力。仅需19.99美元即可体验新功能。4分钟内完成46页学术论文和10分钟播客的转换。性能超OpenAI DR40%,价格仅为其十分之一。

Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束

一位AI公司CEO细数Llama 4五大疑点,包括长上下文、发布表现不佳、代码质量差等问题,并指出规模化已结束,大语言模型可能成为经济上失败的产品。NYU教授马库斯认为,真正智能需要意图远见,而非模式识别或捷径的数学推理。

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

路由LLM通过预训练Router动态分配任务输入到多个开源小模型,突破大模型研究的算力垄断、成本壁垒和技术路径单一化问题。RouterEval提供了Model-level Scaling Up现象和Oracle Router的概念,揭示了多候选分类挑战和部署复杂度等未来研究方向。

Llama 4爆料大反转,没在测试集上训练!华人员工实名辟谣,LeCun出面救火

Meta针对Llama 4训练作弊的爆料迅速反击,但模型的实际表现却频频被吐槽。Ahmad Al-Dahle澄清不同平台间质量差异是因为开源行为,Yann LeCun力挺模型。尽管存在争议,Llama 4在某些测试中的表现令人失望。