NeurIPS 2024最佳论文揭晓!北大字节VAR获最佳论文,清华厦大研究获提名

NeurIPS 2024最佳论文出炉,3篇华人一作。其中,《Visual Autoregressive Modeling》提出了一种新的图像生成框架,能显著超越现有的自回归模型和扩散模型;《Stochastic Taylor Derivative Estimator》展示了高效算法优化神经网络损失函数,并提供了内存减少和速度提升;《Not All Tokens Are What You Need for Pretraining》引入了选择性语言建模方法提升了预训练性能;《Guiding a Diffusion Model with a Bad Version of Itself》提出自引导方法提高图像生成质量。

腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放

腾讯发布超大规模视频生成模型混元,参数量达130亿,并已上线用户试用。该模型具备超写实画质、高语义一致性和流畅运动画面等优势。同时支持多镜头切换和动作生成等功能。

何恺明MIT开门弟子名单公开:奥赛双料金牌得主、清华姚班学霸在列

何恺明团队入驻MIT后公布的研究成果包括使用连续标记的Fluid模型刷新FID和GenEval分数的文本到图像生成,以及跨不同机器人的异构预训练架构HPT。博士生邓明扬在竞赛中表现出色,黎天鸿负责表示学习和生成模型研究,并担任ICLR 2025区域主席。团队还包括白行健和Jake Austin等成员。