提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题

中科院自动化所张兆翔教授团队研发的TC-Light生成式渲染器,能够有效处理具身场景中复杂和剧烈运动的长视频序列,提升光照与纹理的重渲染效果,同时保持良好的时序一致性和低计算成本。

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

Mobile-R1团队提出了一种新的交互式强化学习框架Mobile-R1,结合任务级奖励和多阶段训练流程,显著提升了基于视觉语言模型的移动代理能力。通过三阶段训练过程(格式微调、动作级在线训练和任务级在线训练),Mobile-R1成功处理了包括用户指令在内的复杂任务,展示了在动态环境中进行有效学习的能力。