强化学习
只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%
南加州大学团队利用LoRA+强化学习在AIME 24数学基准测试上实现超过20%的性能提升,成本仅为9美元。研究发现LoRA模型中减少计算反而能带来更好的性能。
3.6B参数逆袭7B巨头!北航开源TinyLLaVA-Video-R1:小模型竟靠强化学习吊打大模型?
北京航空航天大学推出的小尺寸视频推理模型TinyLLaVA-Video-R1通过强化学习显著提升了小规模模型的性能,并开源了权重、代码和训练数据。该模型参数量不超过4B,在多个基准测试中表现优异,具备强大的多模态理解能力和可解释性生成能力。
上海车展见证历史:从「西为中用」到「中为西用」,行业风向标携手Momenta
上汽大众与Momenta在2025年上海车展上宣布合作,标志着中国汽车从’技术输血’到’智能造血’的历史性转变。这次合作被视为合资车企的里程碑时刻,预示着中国汽车标准将走向全球引领。
清华出手,挖走美国顶尖AI研究者!前DeepMind大佬被抄底,美国人才倒流中国
清华聘任前谷歌DeepMind科学家Alex Lamb为助理教授,美国AI人才反向流动加速。此前他曾看低中国AI研究,现选择加入清华大学。多位美国AI专家表示考虑离开,特朗普政府的移民政策加剧了这一趋势,中国正成为AI人才的主要目的地。