ICLR 2025 阿里等提出LLaVA-MoD,用MoE+蒸馏训练轻量化多模态大模型 下午4时 2025/03/07 作者 PaperWeekly 小模型的网络结构,并提出 Dense-to-Sparse 蒸馏框架,结合两阶段蒸馏策略(模仿蒸馏+偏
WWW 2025 TAMU、UIUC等提出全新因素链框架,用于论文-评审人匹配 下午11时 2025/03/05 作者 PaperWeekly 提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评