最新125种多模态大模型技术全面综述 2025年6月20日14时 作者 PaperAgent 两篇论文综述了从2021年至2025年开发的至少125个多模态大型语言模型,涵盖文本到图像、音乐、视频、人类动作和3D对象等多种生成任务。文章强调自监督学习、专家混合等关键技术,并提出了MLLMs融合策略和技术分析框架。
谢赛宁新作爆火,扩散模型新赛道诞生!测试时计算带飞,性能飙到天花板 2025年1月18日12时 作者 新智元 新智元报道 编辑:编辑部 HYZ 【新智元导读】 划时代的突破来了!来自NYU、MIT和谷歌的顶尖研