大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

MLE-Dojo是首个为训练和评测大模型智能体设计的交互式环境,它能模拟机器学习工程师的真实工作流程。目前八个顶尖的大语言模型在200多个真实Kaggle竞赛上的测试中,Gemini-2.5-Pro表现最佳,但仍有改进空间。

超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架

SGLang团队联合美团搜推平台和Cloudsway.AI开源SpecForge,这是一个专为投机采样训练而设计的框架。它支持超大模型并显著提升了推理效率,通过集成Eagle3技术实现了2.18倍的加速效果。

斯坦福大模型推理课免费了,谷歌推理团队创始人主讲

谷歌DeepMind负责人Denny Zhou分享了关于大模型推理过程和方法,强调了中间思考步骤的重要性。他提出思维链能帮助Transformer解决复杂问题,提升答案准确性和可靠性,并指出未来的研究方向包括非唯一可验证答案的任务及实际应用。