耦合采样方案归档 - 每时AI

ml-diffucoder：探索和改进用于代码生成的掩码扩散模型

2025年7月4日8时作者 NLP工程化

ml-diffucoder提出耦合采样方案提升扩散模型效率，并引入自回归性评分量化生成过程中的因果模式，探讨扩散模型在代码任务的独特表现。

苹果与港大出手！改进GRPO，让dLLM也能高效强化学习

2025年6月27日23时作者机器之心

。
不同于基于 Transformer 的自回归式语言模型，dLLM 基于掩码式扩散模型（maske