强化学习
8大类,100+技术:大模型 AI Agents 优化最新综述
华东师范大学等综述了针对大型语言模型的AI智能体优化方法,分为参数驱动和非参数驱动两大类,并详细探讨了基于强化学习、混合策略及经验反馈等多种具体技术。
ICLR 2025 真正「Deep」的「Research」,通过强化学习实现可自主进化的科研智能体来了!
CycleResearcher 研究团队发布了首个通过强化学习迭代优化训练的 AI 科研智能体,实现了文献检索、模型提问、论文撰写等完整闭环。团队开源了数据集和代码,展示了其在学术研究中的潜力。
上海AI Lab发布LLM高效Reasoning综述!全面总结如何“少想多做”
MLNLP社区致力于促进机器学习与自然语言处理领域的学术交流与进步。文章介绍了如何解决大型推理模型(LRMs)带来的冗余思考问题,包括字数预算、双系统切换、模型路由等方法,并探讨了未来高效推理的发展方向。
刚刚!魔法原子举办2025场景战略发布会 今年将量产400台人形机器人
魔法原子举办「原子双生」2025场景战略发布会,推出人形机器人和四足机器人,并宣布量产计划及落地应用场景。预计今年将有400台人形机器人进入工业、商业场景。人形机器人小麦在商场不同场景展示多样化工作岗位,并展示了与追觅科技合作的具身智能大模型原子万象。
人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
人形机器人独角兽Figure展示了利用强化学习实现的自然人形行走技术,机器人步态更像人、速度更快,并且在不同场景下均表现出优异性能。