月度归档: 2025 年 4 月
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
近日,大连理工大学与莫纳什大学的研究团队提出VLIPP框架,通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因,并提出两阶段方法,利用视觉语言模型预测运动路径,再用细粒度的视频扩散模型生成符合物理规则的视频。
4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理
伯克利联合英伟达提出PS3视觉编码器,首次在4K超高分辨率下高效预训练,并引入高分辨率基准测试集4KPro。该方法显著提升了高清场景下的表现和效率。
豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1
字节跳动发布豆包1.5·深度思考模型,采用MoE架构,参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平,具备‘边想边搜’、视觉理解等实用能力。