ICLR2025 打破次元壁!同济提出FaceShot,让表情包、玩具也能“开口说话”!

同济大学提出FaceShot,打破传统肖像动画局限,使非人类角色如表情包、玩具等也能’开口说话’。通过语义引导关键点匹配和坐标系建模动作变换,实现了高精度的动作迁移和身份保持。

DeepSeek-R1-Zero被“轻松复现”?10%训练步数实现数学代码双领域对齐

通过SRPO方案,快手Kwaipilot团队在处理数学与代码混合数据时实现了效率和效果的双赢。SRPO结合了两阶段训练范式和历史重采样技术,仅用10%的训练步数,在AIME24和LiveCodeBench基准测试中超越了现有模型的表现。

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

研究团队提出ManipTrans方法,通过两阶段迁移学习实现从人类手到机械灵巧手的操作技能转移。该方法利用通用轨迹模仿器预训练模型模仿人类手部动作,并引入残差学习模块对动作进行精细调整。同时发布DexManipNet大规模数据集用于验证。

清华提出Test-Time RL,无需标注,模型自学,正确率飙升159%,实现终身学习

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。论文介绍了一种无需标注数据的新方法TTRL,展示了其在数学推理任务上的显著提升效果。

谷歌最新发布68页AI提示词工程,我把它做进了DeepSeek的知识库,附链接

MLNLP社区是国内外知名的机器学习与自然语言处理社区。Google发布了提示词工程白皮书,涵盖配置参数、技巧及最佳实践等内容。作者使用Coze搭建了Google提示词助手小工具,可帮助用户掌握写高质量提示词的技巧,并提供相关术语介绍和改写示例。