NeurIPS 2024|视频生成模型是世界模型吗?iVideoGPT: 交互式视频GPT,一种可扩展的世界模型
↑ 点击
蓝字
关注极市平台
作者丨吴佳龙
来源丨THUML
编辑丨极市平台
极市导读
本文提出一种
↑ 点击
蓝字
关注极市平台
作者丨吴佳龙
来源丨THUML
编辑丨极市平台
极市导读
本文提出一种
Ilya Sutskever在NeurIPS 2024中指出,预训练时代即将结束,并预测未来将是超级智能的时代。他认为数据增长已经接近瓶颈,而Agent系统和合成数据将成为突破预训练方法的关键。他相信未来的AI将发展成能够自主推理和决策的‘Agent’,甚至具备某种形式的自我意识。
洛桑联邦理工学院的研究团队开发了一种仿生鸟腿设计的无人机 RAVEN,能够像乌鸦一样跳跃起飞,并在地面上灵活移动。该研究论文已发表于《Nature》。
该工作提出了一种基于Q变分损失的扩散策略优化方法(QVPO),解决了扩散模型与在线强化学习结合的问题,提高了样本效率和最终表现。
本文提出了一种实用且紧致的图像压缩感知网络PCNet,旨在提高压缩感知技术的图像信息保留能力和重建精度。在多个基准数据集上的实验结果表明,其性能显著优于其他方法。