LLaDA 归档 - 每时AI

冲击自回归，扩散模型正在改写下一代通用模型范式

2025年6月5日8时作者机器之心

睛无数，各种 AI 模型、技术、工具、服务、应用让人目不暇接。在这其中，
Gemini Diffus

2025年2月19日8时作者 NLP工程化

LLaDA 将扩散模型应用于大规模语言建模，提出了一种新方法解决传统语言模型无法逆向生成内容的问题，并在多个任务上表现出色。

2025年2月18日12时作者量子位

人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型，使用扩散模型替代自回归，挑战了大语言模型的固有限制，并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。