3.6B参数逆袭7B巨头!北航开源TinyLLaVA-Video-R1:小模型竟靠强化学习吊打大模型?

北京航空航天大学推出的小尺寸视频推理模型TinyLLaVA-Video-R1通过强化学习显著提升了小规模模型的性能,并开源了权重、代码和训练数据。该模型参数量不超过4B,在多个基准测试中表现优异,具备强大的多模态理解能力和可解释性生成能力。

【书单】没有这6大底座,别谈AI转型!真正阻碍企业进化的,是过时的思维方式!

五一期间利用碎片时间学习《麦肯锡讲全球企业数字化》,理解AI时代下企业的六大企业级数字化能力,包括重构核心业务、人才组织力等,为企业构建长期竞争优势。

不是 R2,不是 V4,DeepSeek 却悄悄放了个 6710 亿参数的狠活

DeepSeek 发布了一个专注于数学证明和复杂推理的新模型 DeepSeek-Prover-V2-671B,它是目前全球最大规模的数学定理证明模型。该模型在多个数学评测数据集上表现出色,可应用于数学论文验证、教材开发及数学研究助理等场景。