ACL 2025 Oral 你的模型评测搭子上线:Evaluation Agent懂你更懂AI
来自上海人工智能实验室与新加坡南洋理工大学的研究者开发了Evaluation Agent,一个AI评估工具,能根据用户需求动态分析视觉生成模型的表现,提高评估效率、灵活性和可解释性。
来自上海人工智能实验室与新加坡南洋理工大学的研究者开发了Evaluation Agent,一个AI评估工具,能根据用户需求动态分析视觉生成模型的表现,提高评估效率、灵活性和可解释性。
视频生成技术在快速发展中,从早期的低质量片段发展到现在的高清数分钟视频。阿里云团队提出的新算法Tora2通过融合多主体参考图像与运动轨迹指令实现外观一致性与轨迹控制。
多模态理解与生成新方法ThinkDiff在ICML2025上提出,仅需少量数据和计算资源,让扩散模型具备推理能力,并通过视觉-语言训练和掩码策略传递VLM的多模态推理能力,大幅提高图像生成质量。
Anthropic 重新聘回 Claude Code 的关键负责人,导致公司估值冲到 1000 亿美元。Claude Code 成为 Anthropic 的拳头产品,贡献了超过 2 亿美元的年化收入。
普林斯顿大学联合多所顶尖机构推出Goedel-Prover-V2模型,实现形式化数学推理的新突破。该模型在MiniF2测试集上性能超越DeepSeek-Prover-671B和Kimina-Prover-72B。