
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

-
论文标题:MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities -
论文链接:https://arxiv.org/abs/2404.13322 -
项目地址:https://github.com/Fantasylii/mergenet
图 1. 知识蒸馏、骨干共享和 MergeNet 的比较

和
表示知识迁移后两个模型的参数。为了综合利用两模型的知识,在此引入低秩参数知识适配器(LPKA)。该机制用于从低秩矩阵中提取知识,并合并来自不同模型的知识以生成新的参数。
和
按行 / 列展平,利用注意力机制将源模型的知识整合到目标模型中:



-
训练过程中自学习的比例的影响
图 3. 训练过程中自学习的比例的消融实验-
各组件的有效性

(文:机器之心)