跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

LLaDA

冲击自回归,扩散模型正在改写下一代通用模型范式

2025年6月5日8时 作者 机器之心

睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。在这其中,
Gemini Diffus

分类 学术、 资讯 标签 LLaDA、 MMaDA、 qdLLM、 多模态交互、 扩散蛋白质语言模型、 文本处理 发表评论

Text Diffusion,来了!

2025年5月31日14时 作者 Datawhale

i Diffusion引起了一波热烈的讨论,其实早在几个月前,就有一个叫Mercury Coder产

分类 分享 标签 GPT-2、 LLaDA、 变长问题、 多轮对话、 开源社区、 自回归模型 发表评论

大型语言扩散模型

2025年2月19日8时 作者 NLP工程化

LLaDA 将扩散模型应用于大规模语言建模,提出了一种新方法解决传统语言模型无法逆向生成内容的问题,并在多个任务上表现出色。

分类 开源 标签 80亿参数、 LLaDA、 下一代LLM、 扩散模型、 自回归模型、 逆向推理 发表评论

嚯!大语言扩散模型来了,何必只预测下一个token 人大高瓴&蚂蚁

2025年2月18日12时 作者 量子位

人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。

分类 资讯 标签 LLaDA、 大语言模型、 扩散模型、 监督微调、 蚂蚁集团、 高瓴人工智能研究院 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×