机器之心，作者每时AI - 第35页共134页

舍弃自回归！国内团队打造纯扩散多模态大模型LLaDA-V，理解任务新SOTA

2025年5月27日16时作者机器之心

本文介绍的研究团队将语言模型 LLaDA 拓展至多模态领域，推出扩散大语言模型 LLaDA-V。该模型在多个基准测试中表现出色，并展示了扩散模型在多模态理解领域的巨大潜力。

2025年5月27日16时作者机器之心

帮助该公司制定了 AI 战略，某种程度上也改变了全世界的大模型格局。然而，令人意想不到的是，短短几年

2025年5月27日16时作者机器之心

北京大学宋国杰教授团队综述论文首次系统梳理大语言模型心理测量学，提出三大革新方向，涵盖评估原则变革、新范式设计与应用项目反应理论。

2025年5月27日16时作者机器之心

上海交大等团队推出Visual-ARFT项目，专为视觉语言模型设计多模态智能体训练方法，实现图像理解与操作能力。项目开源并测试表明其在复杂任务中超越GPT-4o，展现强大工具调用和推理能力。

2025年5月27日16时作者机器之心

理能力。然而，RL 在推理任务之外的应用，尤其是在目标检测和目标定位等感知密集型任务中的应用，仍有

2025年5月27日16时作者机器之心

本文提出了一种新的端到端视觉 tokenizer 调优方法 ETT，解决了传统方法存在的问题，显著提升了多模态任务的性能。

2025年5月27日16时作者机器之心

CVPR 2025 论文分享会将在北京举办，主题包括多模态和视频生成。邀请顶级专家、论文作者参加Keynote演讲和圆桌对话，同时发布部分论文的摘要。

2025年5月26日23时作者机器之心

扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。该方法将反向扩散过程中的每一步中

2025年5月26日23时作者机器之心

上周谷歌举办了一场开发者大会，祭出一堆好东西，其中最让人震撼的就是 Veo3。
该模型具备强大的文

2025年5月26日23时作者机器之心

系统的重要基石。
然而，模型能力的提升伴随着计算资源与存储需求的急剧增长，如何实现高性能与高效率并存