强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍
普林斯顿大学和华沙理工的研究表明,将对比 RL 扩展到1000层可以显著提高自监督强化学习的性能,在各种机器人任务中可实现50倍以上的提升。
普林斯顿大学和华沙理工的研究表明,将对比 RL 扩展到1000层可以显著提高自监督强化学习的性能,在各种机器人任务中可实现50倍以上的提升。
清华大学计算机系卢昊飞、吴哲等人提出的BodyGen框架在ICLR 2023中获得最佳论文奖。该框架通过高效的位置编码器和集中式的神经中枢网络,实现了形体控制和形态设计的协同优化,并显著提升了机器人性能。
MLNLP社区是国内外知名的人工智能学术社区,其愿景是促进机器学习与自然语言处理领域内的交流合作。论文《Stop Overthinking》探讨了高效推理的方法及其在自动驾驶和医疗诊断等领域的应用挑战,提出模型优化、动态压缩和提示工程三大方向的研究进展及未来展望。
提出了EdgeTAM,这是一个基于SAM 2的高效视频分割模型。EdgeTAM通过引入2D空间感知器
本文探讨了基于树搜索的大语言模型推理中的「过思考」与「欠思考」问题,并提出高效树搜索框架 Fetch 解决方案,显著降低了计算开销并提升了性能。
高中生 Adi Singh 创建的 Minecraft Benchmark(MC-Bench)让玩家投票评估不同 AI 模型在 MineCraft 中的建造作品,涵盖指令遵循、代码完成度和创造力三个维度。
前字节跳动 AI 专家解浚源加入千寻智能,后者是国内领先的具身智能公司。解浚源在大模型和机器人技术上有丰富经验,加盟将为千寻智能注入技术动力。