突破户外RGB-only SLAM尺度漂移难题,精确定位+高保真重建 ICCV’25开源

香港科技大学(广州)研究团队提出了一种名为S3PO-GS的户外单目SLAM框架,该方法通过开发自洽跟踪模块、设计动态建图机制和构建联合优化架构等核心技术突破,实现了RGB单目SLAM的全局尺度一致性。在Waymo、KITTI及DL3DV三大户外基准测试中,S3PO-GS显著提升了定位精度与重建质量。

医学领域也有世界模型了:精准模拟肿瘤演化,还能规划治疗方案

香港科技大学(广州)等机构提出医学世界模型MeWM,能够基于临床治疗决策模拟肿瘤演变过程,并支持个性化治疗方案选择。其核心功能包括肿瘤演变模拟、生存风险预测和临床决策闭环优化。在真实肝癌场景下验证了其有效性,通过生成逼真的术后影像提高了医生的识别准确率。

中文网页检索挑战上线!GPT-4o准确率仅6.2%,这份新基准打脸所有大模型

港科大联合发布的新基准测试集BrowseComp-ZH显示,20多个主流大模型在中文网页检索任务中的准确率普遍低于10%,OpenAI的DeepResearch仅得42.9%。研究强调当前主流模型还需提升多轮搜索和信息整合能力。

让机器人更像人类有了新方法!港科大新算法对齐人机动作形态,无需重复训练,轻量模块通用且适配

基于大规模人类视频数据的视觉预训练在开发机器人操作算法方面展示了潜力。然而,人-机器人动作之间的数据域差异是实现有效迁移的关键障碍。香港科技大学团队提出HR-Align新范式,利用人类与机器人的动作对来弥合这一差距,从而提高从预训练模型中学习到的视觉系统在实际机器人任务中的性能。

CVPR 2025:无需物理引擎,一个模型搞定图像渲染与分解

Uni-Renderer团队在CVPR 2025上提出了一种双流扩散框架,实现了渲染和逆渲染的统一。通过改进的timestep调度策略、材质编辑和重光照功能等技术,该模型在性能方面达到了新SOTA水平,并且在合成数据集上的表现优于现有方法。

AI大佬曼宁转赞,MetaGPT团队首提「Atom of Thoughts」,原子化思考让4o-mini暴打推理模型?

AoT 是 MetaGPT 开源社区的作者团队研发的新模型,由滕枫蔚、吴承霖等人组成。AoT 核心在于利用马尔可夫过程将复杂推理分解为一系列轻量级的‘原子问题’,避免历史信息依赖,提高计算效率。

上海交大新聘AI博导,27岁!

27岁清华博士张林峰担任上海交通大学人工智能学院助理教授、博士生导师。他在大模型量化、高效推理等方向取得显著成果,发表多篇论文被广泛引用。他曾在多家学术会议与期刊中担任审稿人,并在不同机构中得到应用。