提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题

中科院自动化所张兆翔教授团队研发的TC-Light生成式渲染器,能够有效处理具身场景中复杂和剧烈运动的长视频序列,提升光照与纹理的重渲染效果,同时保持良好的时序一致性和低计算成本。

紫东太初开源视觉神经增强方法,即插即用终结多模态幻觉 ACL 2025

通过识别并增强视觉敏感的注意力头,中科院自动化所联合新加坡国立大学、东南大学提出了一种高效解决大模型幻觉问题的新方法VHR。该技术量化注意力头对视觉信息的敏感度,并动态强化这些视觉感知头,显著降低模型基于语言先验而产生的幻觉现象。

CVPR’25 workshop冠军方案!中科院&字节Seed提出BridgeVLA:视觉干扰、任务组合等泛化场景轻松拿捏

中科院自动化所与字节跳动联合提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一的2D空间来改进3D VLA模型设计,大幅提高了数据效率和任务成功率。