嚯!大语言扩散模型来了,何必只预测下一个token 人大高瓴&蚂蚁 2025年2月18日12时 作者 量子位 人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。