ml-diffucoder:探索和改进用于代码生成的掩码扩散模型 2025年7月4日8时 作者 NLP工程化 ml-diffucoder提出耦合采样方案提升扩散模型效率,并引入自回归性评分量化生成过程中的因果模式,探讨扩散模型在代码任务的独特表现。
苹果与港大出手!改进GRPO,让dLLM也能高效强化学习 2025年6月27日23时 作者 机器之心 。 不同于基于 Transformer 的自回归式语言模型,dLLM 基于掩码式扩散模型(maske