机器之心
打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA
论文提出UniGRF统一生成式推荐框架,将召回和排序整合到一个自回归生成模型中,通过Ranking-Driven Enhancer和Gradient-Guided Adaptive Weighter实现高效协作与优化。实验表明其在多个公开数据集上性能显著优于现有SOTA模型。
SIGGRAPH 2025|Large Avatar Model:单图秒级打造超写实3D交互数字人,跨平台超实时驱动渲染
LAM论文提出了一种通过单张图像实现即时驱动高斯头像的方法,无需后处理网络和视频数据训练,支持跨平台实时渲染,已在多模态艺术创作、智能交互对话等领域应用。
突破开放世界移动操作!首个室内移动抓取多模态智能体亮相,微调模型真实环境零样本动作准确率达 90%
上海人工智能实验室联合新加坡国立大学、香港大学等机构的研究团队提出OWMM-Agent,首个专为开放世界移动操作设计的多模态智能体。通过仿真器合成数据微调大模型,在真实环境中实现零样本单步动作预测90%的准确率。
DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究
该研究比较了DPO和GRPO在自回归图像生成中的应用效果,发现DPO在域内任务上表现更好,而GRPO在域外泛化能力上更出色。研究还探讨了不同奖励模型及扩展策略对这两种算法的影响。