ACL 2025 Oral 你的模型评测搭子上线:Evaluation Agent懂你更懂AI

来自上海人工智能实验室与新加坡南洋理工大学的研究者开发了Evaluation Agent,一个AI评估工具,能根据用户需求动态分析视觉生成模型的表现,提高评估效率、灵活性和可解释性。

ACM MM 2025 轨迹可控、主体更稳!阿里Tora2定义下一代视频生成范式

视频生成技术在快速发展中,从早期的低质量片段发展到现在的高清数分钟视频。阿里云团队提出的新算法Tora2通过融合多主体参考图像与运动轨迹指令实现外观一致性与轨迹控制。

ICML2025|多模态理解与生成最新进展:港科联合SnapResearch发布ThinkDiff,为扩散模型装上大脑

多模态理解与生成新方法ThinkDiff在ICML2025上提出,仅需少量数据和计算资源,让扩散模型具备推理能力,并通过视觉-语言训练和掩码策略传递VLM的多模态推理能力,大幅提高图像生成质量。

普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B

普林斯顿大学联合多所顶尖机构推出Goedel-Prover-V2模型,实现形式化数学推理的新突破。该模型在MiniF2测试集上性能超越DeepSeek-Prover-671B和Kimina-Prover-72B。