95后北大校友挑起ChatGPT Agent大梁!今年刚博士毕业,曾获陶哲轩支持的AIMO第二名

OpenAI发布会C位被华人占据,孙之庆、马丁(MengTian)李和张熙堃等华人员工参与重要项目。小扎挖角多名OpenAI研究员后引起关注,首席研究官Mark Chen离职加入Meta,Alexandr Wang成为全球最年轻的亿万富豪之一。

提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题

中科院自动化所张兆翔教授团队研发的TC-Light生成式渲染器,能够有效处理具身场景中复杂和剧烈运动的长视频序列,提升光照与纹理的重渲染效果,同时保持良好的时序一致性和低计算成本。

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

Mobile-R1团队提出了一种新的交互式强化学习框架Mobile-R1,结合任务级奖励和多阶段训练流程,显著提升了基于视觉语言模型的移动代理能力。通过三阶段训练过程(格式微调、动作级在线训练和任务级在线训练),Mobile-R1成功处理了包括用户指令在内的复杂任务,展示了在动态环境中进行有效学习的能力。

AI“压力面”,DeepSeek性能暴跌近30% 清华&上海AI Lab

给大模型来一场‘压力测试’,研究团队设计REST框架,在一个多任务并行推理场景中发现顶级模型的表现大幅缩水。通过上下文预算分配、跨问题干扰抵抗和动态认知负载管理等能力评估,揭示了当前评测方法的局限性,并提出了新的评测数据构建范式。

突破户外RGB-only SLAM尺度漂移难题,精确定位+高保真重建 ICCV’25开源

香港科技大学(广州)研究团队提出了一种名为S3PO-GS的户外单目SLAM框架,该方法通过开发自洽跟踪模块、设计动态建图机制和构建联合优化架构等核心技术突破,实现了RGB单目SLAM的全局尺度一致性。在Waymo、KITTI及DL3DV三大户外基准测试中,S3PO-GS显著提升了定位精度与重建质量。