DPO损失函数归档

多模态大模型文心4.5后训练详解

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流与发展，涵盖硕博生、高校老师及企业研究人员。文心4.5开源10个多模态大模型，并介绍其后训练阶段的技术细节。