泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

腾讯研究团队采用强化学习结合课程采样策略训练意图识别模型,显著提升其在未知意图上的泛化能力。该方法能有效指导模型关注更具挑战性的数据样本,并通过实验验证了GRPO算法优于传统SFT方法的性能优势。

DiffMoE:动态Token选择助力扩散模型性能飞跃,快手&清华团队打造视觉生成新标杆!

本文介绍清华大学与快手可灵团队合作的DiffMoE研究,通过动态token选择和全局token池设计提升扩散模型效率。论文在ImageNet分类图像生成任务中仅用4.58亿参数即超越6.75亿参数的Dense-DiT-XL模型。

阶跃星辰×光影焕像联合打造超强3D生成引擎Step1X-3D!还开源全链路训练代码

阶跃星辰与光影焕像联合发布并开源高参数量3D大模型Step1X-3D,参数4.8B。该模型具备生成高质量、可控的三维内容能力,在数据处理和纹理细节上进行技术创新,并提供完整的训练代码以促进社区发展。