点赞归档 - 第2页共4页 - 每时AI

「不思考」反而更强？上海AI Lab重新定义视觉强化学习微调最优路径

2025年5月8日16时作者 PaperWeekly

且在一些模型上取得了优于监督微调（SFT）的成果。
RFT 利用可验证的奖励进行训练，鼓励模型在回答

开源即屠榜！UniME多模态框架登顶MMEB全球训练榜，刷新多项SOTA纪录

2025年5月8日11时作者量子位

SOTA来了！
格灵深瞳、阿里ModelScope团队，以及通义实验室机器智能团队联合发布通用多模态

ICLR 2025 差分注意力机制爆火！DIFF Transformer击穿长文本建模天花板

2025年4月30日16时作者 PaperWeekly

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

10秒生成官网，WeaveFox重塑前端研发生产力蚂蚁徐达峰@中国AIGC产业峰会

2025年4月30日11时作者量子位

如今已非新鲜事。
不过，随着实践的深入，新的问题正在出现：AI生成代码需要大量翻修、安全生产难以保障

扩散模型还原被遮挡物体，几张稀疏照片也能”脑补”完整重建交互式3D场景｜CVPR’25

2025年4月23日16时作者量子位

就能重建出一个完整、细节丰富且可自由交互的3D场景？
在传统方法中，这几乎是不可能完成的任务，稀少的

GPT-4o能拼好乐高吗？首个多步空间推理评测基准来了：闭源模型领跑，但仍远不及人类

2025年4月23日11时作者量子位

拼好乐高吗？
你有没有想过这样的问题：
多模态大语言模型真的具备理解和推理空间结构的能力吗？
在多步

视觉自回归生成理解编辑大一统！北大团队多模态新突破，训练数据代码全面开源

2025年4月15日11时作者量子位

和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。这些模型通过整合文本、图像、音频等多种数

人类一生所学不过4GB，加州理工顶刊新研究引热议

2025年4月13日16时作者量子位

4GB
的“知识储量”？
科学家们最新研究，计算出了人类学习积累上限，就这么多~~
（甚至还不如一

精度飙升13.7%！复旦发布CAD参数化新基准，PHT-CAD框架精准解析工程图纸

2025年4月2日16时作者 PaperWeekly

性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。
为了填补学术社区中这一