大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

MLE-Dojo是首个为训练和评测大模型智能体设计的交互式环境,它能模拟机器学习工程师的真实工作流程。目前八个顶尖的大语言模型在200多个真实Kaggle竞赛上的测试中,Gemini-2.5-Pro表现最佳,但仍有改进空间。

超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架

SGLang团队联合美团搜推平台和Cloudsway.AI开源SpecForge,这是一个专为投机采样训练而设计的框架。它支持超大模型并显著提升了推理效率,通过集成Eagle3技术实现了2.18倍的加速效果。

「AI 罗永浩」带货爆卖 5500 万后,百度又发布了更强的数字人技术 WAIC2025

百度推出新一代数字人技术NOVA,可独立完成脚本创作、语音演绎、动作生成和直播互动。NOVA使数字人主播更像具备表演能力的AI角色,支持双人互动及复杂的对话场景,并提升内容创作与直播间调度能力。

ICML 2025 CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通

本文介绍了一种名为 CoTo 的训练策略,通过在 LoRA 微调过程中随机失活一部分适配器并逐渐提高其激活概率,有效缓解了层级不平衡和「懒惰」优化问题。该策略提高了模型在多任务融合和剪枝等操作上的鲁棒性和有效性,并已被 ICML 2025 接收。