ACL 2025 Oral 你的模型评测搭子上线:Evaluation Agent懂你更懂AI

来自上海人工智能实验室与新加坡南洋理工大学的研究者开发了Evaluation Agent,一个AI评估工具,能根据用户需求动态分析视觉生成模型的表现,提高评估效率、灵活性和可解释性。

人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队合作研究Diffusion Transformers的超参优化,提出μP理论并将其应用于实际模型训练。通过大规模实验验证了该方法的有效性,并开放论文代码供进一步研究。