LLM面经——多模态大模型训练中”模态懒惰“问题如何解决? 2025年7月2日23时 作者 极市干货 读 本文 深入探讨了多模态大模型训练中常见的“模态懒惰”和“模态偏差”问题,即不同模态在信息贡献上的
音画同步,AI视频也能有完美「原声音」,可灵AI刚上线的! 2025年6月27日23时 作者 机器之心 bubu 有了超萌专属 BGM: 视频来自可灵 AI 创意圈用户。 复杂的自然环境也可以获得相应的背
Information Fusion 综述论文:基于视触觉传感器的触觉数据生成与应用 2025年4月17日23时 作者 机器人大讲堂 多模态数据集中的视触觉传感器综述论文总结了视触觉信息的生成方法及其应用。文章介绍了基于物理和学习的技术,涵盖了弹性体模拟、光学模拟、标记物运动模拟及跨模态与真实迁移生成方法,并提出标准化评价规则。
达摩院开源了一个从在线教学视频中提取的多模态数据集 2025年1月17日8时 作者 NLP工程化 达摩院发布多模态数据集,包含650万张图片和8亿文本,来自2.2万小时在线教学视频,涵盖数学、物理、化学等基础学科。