学术归档 - 第59页共283页

CVPR 2025 训练效率提升42%！上交&腾讯优图&浙大发布IAR：打破LLM视觉生成瓶颈

2025年6月10日23时作者极市干货

海交通大学、腾讯优图、浙江大学联合推出 IAR 方法，通过码本重排策略和面向簇的交叉熵损失，提升自回

2025年6月10日23时作者机器之心

该研究提出了一种高效的方法来构建具有良好生成质量的混合架构，通过嫁接现有算子以实现显著加速，并在实时计算速度上实现了1.43倍的提升。

2025年6月10日16时作者机器之心

香港科技大学联合快手可灵团队提出EvoSearch方法，通过演化搜索提升视觉生成模型的性能。该方法无需训练参数，仅需计算资源即可在多个任务上取得显著最优效果，并且具有良好的扩展性和泛化性。

2025年6月10日16时作者 PaperWeekly

ReasonMap 是首个聚焦于高分辨率交通图的多模态推理评测基准，用于评估大模型在理解图像细粒度结构化空间信息方面的能力。

2025年6月10日16时作者机器之心

可能。
近年来，视频合成技术已经取得了显著突破。其中，基于双向注意力机制的扩散 Transforme

2025年6月10日16时作者 PaperWeekly

GNNs 在图分类与图回归任务中的潜力。
为此，本文通过提出 GNN+ 框架，将六项常用超参数技术（

2025年6月10日16时作者机器之心

怎么能从下一个 token 预测中学到这么多，而视频模型从下一帧预测中学到的却那么少？难道是因为大模

2025年6月10日16时作者 PaperWeekly

，带来端侧性能创新式大跃升；一款 0.5B 实力演绎以小博大，适配广泛终端场景。
MiniCPM4.

第五届中国情感计算大会（CCAC 2025）将于7月18-20日在四川成都举办，聚焦情感计算与人工智能等领域的交叉融合。会议包含特邀报告、青年科学家论坛、企业论坛等多个环节，并提供多种注册方式和费用。

2025年6月10日11时作者机器之心

王劲提出FUDOKI，一种基于非掩码离散流匹配架构的通用多模态模型，实现了图像生成与文本理解的统一建模。