PaperWeekly，作者每时AI - 第40页共45页

复旦&微软提出StableAnimator：首个端到端的高质量ID一致性人类视频生成新框架

2024年12月24日20时作者 PaperWeekly

扩散模型近年来在图像和视频生成方面取得了显著成功，极大地激发了图像动画领域的研究。
尤其是人像图像动

大语言模型的知识蒸馏（KD）应该用Reverse KL？

2024年12月23日8时作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
Taki5
单位 |
香港大学
研究方向 |
LLM

AAAI 2025 浙大、蚂蚁等提出全新跨域微调框架，构筑更好的大模型隐私保护

2024年12月19日22时作者 PaperWeekly

©作者 |
姚凯
单位 |
蚂蚁摩斯、浙江大学
要让大模型适应各不一样的下游任务，微调必不可少。常规

南加大团队提出MARVEL：基于认知科学的多维抽象视觉推理基准测试

2024年12月19日22时作者 PaperWeekly

研究团队提出MARVEL数据集来评估多模态大语言模型的抽象视觉推理能力，该数据集中包含了770个高质量测试样例，并覆盖了六种核心知识模式、多样化的几何和抽象形状输入以及五种不同的任务配置方式。实验结果显示大多数模型在MARVEL上的表现接近随机水平，揭示出模型的视觉感知能力是提升其抽象视觉推理的关键瓶颈。

GPT-4o掀起全模态热潮！一文梳理全模态大模型最新研究进展

2024年12月19日22时作者 PaperWeekly

随着 Gemini 和 GPT-4o 等系列的发布，本文尝试总结一些最近全模态相关的工作。采用联合文

NeurIPS 2024 如何缓解长文本情境下的中间信息丢失问题？

2024年12月18日16时作者 PaperWeekly

最近提出的方法通过在短时间内微调插入位置编码（PE）来有效地扩展预训练 LLM 的上下文窗口。然而，现有的方法仍存在两个显著的局限性：需要对目标长度进行微调，并且难以有效利用来自上下文中间部分的信息。为了解决这些问题，本文提出了 CREAM 方法，通过操纵位置索引来生成较短序列，在保持高效的同时增强模型在处理“中间”内容时的有效性。