苹果发现模型蒸馏Scaling Law!教师模型并非越强越好

苹果最新研究发现模型蒸馏过程中学生模型和教师模型能力之间的幂律关系,揭示了不同参数量、蒸馏数据量以及不同能力的学生模型与教师模型的关系。

好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了

人像视频生成领域的一个新进展,X-Dyna 使用轻量跨视频帧的注意力模块、人脸局部控制模块和人物肢体运动控制模块来实现精准的人物肢体动作及面部表情迁移,并保持自然背景的真实性。