SIGGRAPH 2025|Large Avatar Model:单图秒级打造超写实3D交互数字人,跨平台超实时驱动渲染
LAM论文提出了一种通过单张图像实现即时驱动高斯头像的方法,无需后处理网络和视频数据训练,支持跨平台实时渲染,已在多模态艺术创作、智能交互对话等领域应用。
LAM论文提出了一种通过单张图像实现即时驱动高斯头像的方法,无需后处理网络和视频数据训练,支持跨平台实时渲染,已在多模态艺术创作、智能交互对话等领域应用。
南京航空航天大学团队提出HBS-KGLLM框架,通过增强知识图谱挖掘有害信息结构化知识,实现有效探测LLMs的安全性能。该方法成功率高、成本低,并已在多款主流模型上测试表现优异。
上海人工智能实验室联合新加坡国立大学、香港大学等机构的研究团队提出OWMM-Agent,首个专为开放世界移动操作设计的多模态智能体。通过仿真器合成数据微调大模型,在真实环境中实现零样本单步动作预测90%的准确率。
港中文 MMLab 提出的新方法 MINT-CoT,通过引入‘视觉交错思维链’实现细粒度视觉与文本推理融合,在多个基准数据集上刷新 SOTA,显著提升多模态大模型在数学视觉任务中的表现。