「不思考」反而更强?上海AI Lab重新定义视觉强化学习微调最优路径 2025年5月8日16时 作者 PaperWeekly 且在一些模型上取得了优于监督微调(SFT)的成果。 RFT 利用可验证的奖励进行训练,鼓励模型在回答
开源即屠榜!UniME多模态框架登顶MMEB全球训练榜,刷新多项SOTA纪录 2025年5月8日11时 作者 量子位 SOTA来了! 格灵深瞳、阿里ModelScope团队,以及通义实验室机器智能团队联合发布通用多模态
ICLR 2025 差分注意力机制爆火!DIFF Transformer击穿长文本建模天花板 2025年4月30日16时 作者 PaperWeekly 建模能力为语言理解与生成带来了前所未有的突破。 然而,随着模型规模的不断扩大和应用场景的日益复杂,传
10秒生成官网,WeaveFox重塑前端研发生产力 蚂蚁徐达峰@中国AIGC产业峰会 2025年4月30日11时 作者 量子位 如今已非新鲜事。 不过,随着实践的深入,新的问题正在出现:AI生成代码需要大量翻修、安全生产难以保障
扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25 2025年4月23日16时 作者 量子位 就能重建出一个完整、细节丰富且可自由交互的3D场景? 在传统方法中,这几乎是不可能完成的任务,稀少的
GPT-4o能拼好乐高吗?首个多步空间推理评测基准来了:闭源模型领跑,但仍远不及人类 2025年4月23日11时 作者 量子位 拼好乐高吗? 你有没有想过这样的问题: 多模态大语言模型真的具备理解和推理空间结构的能力吗? 在多步
视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源 2025年4月15日11时 作者 量子位 和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。这些模型通过整合文本、图像、音频等多种数
精度飙升13.7%!复旦发布CAD参数化新基准,PHT-CAD框架精准解析工程图纸 2025年4月2日16时 作者 PaperWeekly 性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。 为了填补学术社区中这一
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤 2025年3月29日11时 作者 量子位 外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC