月度归档: 2025 年 4 月
类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%
中科院自动化研究所与中科紫东太初团队提出了一种结合高质量指令对齐数据与类 R1 的强化学习方法,用于提升目标检测性能。该方法包括召回奖励、精度奖励和渐进式规则调整策略等机制,在多个数据集上实现了显著性能提升。
UI-R1仅136张截图,vivo开源DeepSeek R1式强化学习,提升GUI智能体动作预测
本文介绍了一种基于规则的强化学习(RL/RFT)在GUI智能体领域的应用,UI-R1模型通过精心设计的奖励函数和高效的数据筛选策略提升了跨领域的任务表现。
Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束
一位AI公司CEO细数Llama 4五大疑点,包括长上下文、发布表现不佳、代码质量差等问题,并指出规模化已结束,大语言模型可能成为经济上失败的产品。NYU教授马库斯认为,真正智能需要意图远见,而非模式识别或捷径的数学推理。
迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准
RoboVerse 提出一个统一平台、数据集与评测体系,解决机器人仿真碎片化问题。MetaSim 解决跨仿真器兼容性;大规模合成数据集与标准化评测系统提升性能评估;混合仿真增强真实性;Real2Sim 支持从现实到仿真的资产重建;AI-Generate Tasks 创造新任务;支持 GPU 并行训练加速研究。
20人创业神话,老黄数亿刀收购!AI大牛贾扬清、白俊杰被曝入职英伟达
创立两年的Lepton AI被英伟达收入囊中,贾扬清和白俊杰加入英伟达。Lepton AI专注于人工智能基础设施,通过创新技术提供低成本、灵活的GPU资源解决方案。
CVPR 2025 Highlight 华科、道通智能、英特尔开源双目深度估计大模型MonSter
MonSter是一种新颖的立体匹配方法,通过双分支结构结合单目深度估计和立体匹配的优势,在五个常用基准上均达到SOTA性能,并且在不同数据集上的泛化性表现优异。