RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起

微软副总裁 Nando de Freitas 提出 AI 是一场系统性工程的观点,反对单一技术的过度宣传。他认为AI的进步需要成千上万人的共同努力,并强调了多元参与和技术探索的重要性。

Vision-R1:多模态领域的DeepSeek R1-Zero,7B参数比肩OpenAI O1

Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题,提出冷启动初始化和RL训练方案,并创新性地引入PTST策略和HFRRF奖励函数,显著提升了模型在多个数学推理基准测试中的表现。