视频推理的R1时刻!港中文、清华推出首个Video-R1,7B模型竟超GPT-4o?
港中文联合清华团队发布首个将强化学习范式应用于视频推理的模型Video-R1,该模型通过引入时序建模和混合训练机制,在权威测试中击败了GPT-4o。
港中文联合清华团队发布首个将强化学习范式应用于视频推理的模型Video-R1,该模型通过引入时序建模和混合训练机制,在权威测试中击败了GPT-4o。
Advanced Science青年科学家奖面向全球开放申请,旨在表彰材料科学、化学、物理和工程等领域的年轻科学家。申请条件包括独立PI任职时间不超过10年或45周岁以下,并需提交简历、发表文章清单、推荐信及申请信。申请人须在2025年5月18日前在线提交申请材料。
这篇综述全面梳理了MCoT的理论框架、技术方法及应用前景,为多模态AI研究提供了系统性参考。从传统的链式思维到MCoT,支持多模态数据的自由组合与协同推理,在医学诊断等领域展现出巨大潜力。
模型剪枝方法LLM-Streamline通过判断层的重要性,并进行剪枝来减少模型参数量,同时使用余弦相似度和轻量级蒸馏小模型来弥补损失。该方法具有低内存消耗、合理训练方法以及新的稳定性指标等优势,相比已有方法性能更高。