学术
ICLR 2025 LLaVA-MoD:MoE蒸馏训练轻量化多模态大模型
本文提出了一种轻量化多模态语言模型LLaVA-MoD,通过稀疏专家混合架构和渐进式蒸馏策略,在2B规模下使其性能超过7B大模型8.8%,并在幻觉检测任务中超越教师模型。
人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板
本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。
生成式AI已成科研新引擎?即刻扫码查看威立最新报告!
全球领先的研究与教育出版机构威立发布报告揭示了人工智能在科研工作中的应用现状及挑战,并提供了AI如何节省科研人员时间的信息,以及科研人员对出版机构的期待。
计算效率提升3000倍!崂山实验室等提出海洋环境智能预报大模型「问海」,性能优于数值海洋预报
崂山实验室研发团队通过物理海洋学与人工智能融合,推出全球高分辨率1/12°海洋环境智能预报大模型「问海」。其预测中尺度涡旋性能优于现有数值预报系统,并在计算效率上提升了3000倍。