复旦&微软提出StableAnimator: 首个端到端的高质量ID一致性人类视频生成新框架!

复旦大学与微软等机构提出StableAnimator框架,实现高质量身份一致性人类视频生成。该框架通过全局内容感知面部编码器、分布感知的身份适配器和基于HJB方程的面部优化来保持人物身份信息的一致性并提升视频质量。

NeurIPS 2024 如何缓解长文本情境下的中间信息丢失问题?

最近提出的方法通过在短时间内微调插入位置编码(PE)来有效地扩展预训练 LLM 的上下文窗口。然而,现有的方法仍存在两个显著的局限性:需要对目标长度进行微调,并且难以有效利用来自上下文中间部分的信息。为了解决这些问题,本文提出了 CREAM 方法,通过操纵位置索引来生成较短序列,在保持高效的同时增强模型在处理“中间”内容时的有效性。