开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab

上海AI实验室提出GraphGen,通过知识图谱引导和双模型协同机制提升垂域大模型训练中的问答数据质量。研究团队在OpenXLab平台上推出Web应用,方便用户生成适应LLaMA-Factory和XTuner的高质量训练数据。

从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标

阿里-高德团队提出组策略梯度优化GPG方法,仅需优化原始目标,解决已有方法偏差,提高训练效率。在实验中,GPG性能全面超越现有方法,有望成为下一代基础模型训练的关键方法。