5 月 2025 - 第90页共241页

何恺明等降维打击！彻底颠覆AI生图，无需预训练一步到位

2025年5月21日16时作者新智元

维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能

2025年5月21日16时作者 Z Potentials

于我们在之前的移动平台上经历过很多限制和障碍。从我们的角度来看，这些限制对于开发者来说是相当随意的，

2025年5月21日16时作者量子位

不是选个模型来让大家用就完事了。
如果只是喊口号让大家把AI用起来，结果往往是：
接入了大模型，员工

2025年5月21日16时作者量子位

CMU博士生耿正阳等人提出的新模型MeanFlow无需预训练或课程学习，一步生成ImageNet图像便达到3.43的FID值，显著优于现有技术。

2025年5月21日16时作者量子位

谷歌发布最强视频生成模型Veo 3，能从画面到对白原生直接生成，并且用户可通过自然语言描述角色、场景和指定对白与语气。

2025年5月21日16时作者新智元

FusionSpec创新的框架设计配合昇腾强大的计算能力，将投机
推理框架耗时
降至毫秒级，打破延迟

2025年5月21日16时作者 PaperWeekly

的视频？这个梦想，已经成为现实！
快手与新加坡国立大学联合推出的 Any2Caption，打破了多模

2025年5月21日16时作者新智元

句提示词就能打造电影质感短片，还能音画同步，好莱坞真的要慌了？DeepMind首席技术官更在访谈中透

2025年5月21日16时作者机器之心

金天和郑鈺熹是麻省理工学院的博士生，他们研究了大语言模型生成范式的转变。PASTA 论文介绍了通过策略学习实现异步生成的方法，包括标记语言 PASTA-LANG 和优化训练流程。实验结果表明这种方法能显著提高推理速度并保持输出质量。

2025年5月21日16时作者 PaperWeekly

（例如 RLHF 和 DPO）通过微调模型参数来实现偏好优化。然而，这种“训练时对齐”模式不仅耗时耗