ICLR2025 打破次元壁!同济提出FaceShot,让表情包、玩具也能“开口说话”!
同济大学提出FaceShot,打破传统肖像动画局限,使非人类角色如表情包、玩具等也能’开口说话’。通过语义引导关键点匹配和坐标系建模动作变换,实现了高精度的动作迁移和身份保持。
同济大学提出FaceShot,打破传统肖像动画局限,使非人类角色如表情包、玩具等也能’开口说话’。通过语义引导关键点匹配和坐标系建模动作变换,实现了高精度的动作迁移和身份保持。
oder Transformer 能否加速收敛并增强样本质量?
>>
加入极市CV技术交流群,走在计
仅调整5%骨干网络参数,Mona方法在实例分割、目标检测等视觉任务中超越全量微调效果,显著降低适配和存储成本。
本文介绍了一种名为Zig-RiR的新型医学图像分割模型,通过创新的嵌套结构和锯齿状扫描机制实现了对二维和三维医疗图像的高效精准分割,显著提升了计算效率并降低了GPU内存使用。
21岁华人开发AI作弊工具,获530万美元融资。该工具帮助用户在考试、求职面试等场景中“作弊”。哥大因争议已停学两位创始人。
今麦郎与极视角合作打造AI智能化平台,成功实现全国24个生产基地的安全生产智能化管理。通过智慧安防AI管理系统,今麦郎提高了预警响应速度,并实现了跨区域工厂的安全联动监控,显著提升了生产安全管理水平。
本文深入探讨了Agentic概念,指出其实质仍是经典强化学习(RL)。通过分析字节跳动的VeRL框架和相关实践案例,强调构建高质量、高效能的环境对于推进大模型RL训练的重要性。
UniCombine 是一种基于 DiT 的多条件可控生成框架,能够处理任意条件组合。它在多种多条件生成任务上达到了最先进的性能,并且构建了首个针对多条件组合式生成任务设计的数据集 SubjectSpatial200K。