ACM MM 2025 LGM3A研讨会征稿:探索大模型与多模态的融合创新
我们诚挚邀请您提交论文参加ACM Multimedia 2025大会期间的LGM3A Workshop,该研讨会聚焦于大型生成模型在多模态应用中的潜力。
我们诚挚邀请您提交论文参加ACM Multimedia 2025大会期间的LGM3A Workshop,该研讨会聚焦于大型生成模型在多模态应用中的潜力。
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。科技部发布了修订后的《国家科学技术奖励条例实施细则》,明确每年评审改为每两年一次,新增了提名评审机制、诚信监督和保密要求等内容。
本文介绍了一种基于深度基础模型的循环双目匹配框架DEFOM-Stereo,该框架利用Depth Anything V2的强大预训练ViT和随机初始化的CNN构建联合编码器,并设计了用于单目视差初始化、尺度更新的方法。实验结果表明,在仿真域到真实域的零样本泛化上以及在线Benchmark中均表现优异。
上海人工智能实验室开源生成式世界模型AETHER,首次实现大模型在真实世界中的3D空间决策与规划能力。通过「重建-预测-规划」一体化框架和几何空间建模,大幅提升模型空间推理的准确性与一致性,并成功实现在合成数据上零样本泛化至真实场景。