港科大Apple新研究:Tokens使用量减少,模型推理还更强了
Laser团队提出的新方法提升了大模型的推理效率与准确性,通过统一视角看待不同奖励设计、基于目标长度和阶跃函数的奖励机制以及动态且带有难度感知的目标调整,实现了在减少Tokens使用量的同时保持或提升准确率。
Laser团队提出的新方法提升了大模型的推理效率与准确性,通过统一视角看待不同奖励设计、基于目标长度和阶跃函数的奖励机制以及动态且带有难度感知的目标调整,实现了在减少Tokens使用量的同时保持或提升准确率。
港科广团队提出MultiGO方案,通过分层建模思路实现逼真人体3D模型重建,核心在于采用高斯溅射点作为三维基元,大幅提升单目图像纹理人体重建质量。
文章摘要:顶会论文探讨了强化学习与多目标优化融合提升AI决策能力的技术。港科大和MIT团队通过不同方法在自动驾驶及机器人控制中实现安全性和能效的双重提高;阿里云技术则优化金融交易系统的风险收益平衡,这些成果重塑智能决策边界。
MetaGPT联合多家机构发布《Foundation Agents》报告,概述智能代理的发展与挑战,涵盖模块化架构、脑区功能映射、自我进化机制、协作与进化multi-Agent系统等多方面内容。
港科大与音乐圈合作的开源项目YuE,能生成5分钟长的专业级歌曲,并同时合成人声和伴奏。其双轨版Next-Token Prediction策略能精准捕捉细腻人声,且具有模仿多歌手的能力。
港科广团队提出OpenGS-SLAM解决方案,仅凭RGB图像实现高精度定位与逼真场景重建。通过点图回归网络生成帧间一致的点图,并结合3D高斯地图进行优化,显著提高跟踪精度和鲁棒性。
本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。
国产AI模型DeepSeek-R1在Hugging Face开源社区迅速流行,下载量超70万次,引发美国海军和政府关注。其衍生模型数量每日增长30%,热度持续攀升。谷歌前CEO称这是全球AI发展的重要转折点,并推动Meta、Hugging Face等机构模仿DeepSeek的开发策略。
DrivingWorld模型通过创新的空间-时间解耦机制和高效的编码解码模块,实现了自动驾驶场景的可控生成和超长时间视频生成。该研究由香港科技大学与地平线联合完成,论文、代码均开放获取。