量子位，作者每时AI - 第61页共151页

8秒极速生成！复杂场景图像定制低成本轻松驾驭，已开源丨字节北大联合发布

2025年5月12日16时作者量子位

字节跳动与北京大学提出统一图像定制化生成框架DreamO，支持多条件组合的多样化定制，包括主体、身份、风格及服装参考。该模型通过单一模型实现了多种高质量图像定制化结果，且在成本和速度上具有优势。

2025年5月12日16时作者量子位

play）就能让预训练大模型学会推理？
来自清华、北京通用人工智能研究院和宾夕法尼亚州立大学的研究人

2025年5月12日16时作者量子位

陶哲轩发布视频演示如何借助AI仅用33分钟完成复杂证明，他的订阅量和观看量迅速增长。他开发的数学助手也迎来2.0版本升级，用于简化某些命题逻辑的证明任务。

2025年5月11日16时作者量子位

ModelScope团队提出Nexus-Gen统一模型，融合MLMs和扩散模型能力，实现图像生成、理解与编辑。其技术细节包括预填充自回归策略和统一的数据格式定义。模型已在多个任务上取得GPT-4o级效果，并开源了训练数据、工程框架及论文。

2025年5月11日16时作者量子位

华为与中科院提出DEER模型，通过动态提前退出推理机制，在保持精度的同时显著缩短大模型的思维链长度。

2025年5月11日16时作者量子位

d-Coder
，8B规模，超越Qwen3，拿下多个SOTA。
它证明
“只需极少人工参与，LLM就

2025年5月10日16时作者量子位

阶跃星辰表示将继续坚持基础大模型研发，并强调多模态理解生成一体化的重要性。公司已发布22款基座模型，其中16款为多模态模型。姜大昕解释称，多模态理解生成一体化意味着用一个模型同时完成理解和生成任务，而非三段式过程。他认为这需要更强的综合实力，目前在语言和视觉领域的理解生成一体化研究进展正积极推进。

2025年5月10日16时作者量子位

上海张江的傅利叶机器人宣布未来十年将聚焦康养场景，推出具备温度交互、生动理解与主动执行能力的人形机器人，并发布小尺寸人形机器人Fourier N1。公司已进驻全球3000多家终端医院，提供包括康复治疗和人体运动量化研究在内的多种服务。

2025年5月10日11时作者量子位

“1+1=3”，评测系统却浑然不觉甚至疯狂打Call？是时候给奖励模型打个分了！
来自
清华大学
、

2025年5月10日11时作者量子位

e you）
这是最近网友不断对着
Transformer八子之一的Noam Shazeer
（为方