学术归档 - 第89页共283页

GUI智能体“大脑”升级！浙大&港理工等提出InfiGUI-R1，用强化学习实现深度推理

2025年5月13日16时作者 PaperWeekly

文章介绍了InfiGUI-R1，一个基于Actor2Reasoner框架训练的GUI智能体。该模型旨在提升AI在多步骤操作任务中的能力和可靠性，并能像人类一样先思考后行动。通过推理注入和深思熟虑增强两阶段训练方法，30亿参数的InfiGUI-R1-3B模型在多个基准测试中表现出色。

2025年5月13日16时作者 PaperWeekly

OmniKV 提出了一种创新性的动态上下文选择方法，用于高效处理长上下文 LLM 推理。它无需丢弃任何 Token，通过动态选择实现计算稀疏，显著提升推理速度和吞吐量，且在各种预算下均优于丢弃 Token 的方法。

2025年5月13日14时作者 GiantPandaCV

表到本公众号。原始地址为：https://veitner.bearblog.dev/how-to-u

一年一度的NLP青年学者研讨会YSSNLP2025将于大连召开，会议主题聚焦大模型与语言智能发展，旨在促进国内外青年学者间的学术互动和技术分享。

2025年5月13日11时作者 HyperAI超神经

ker 团队近期利用先进生成模型，通过合成 OLG 设计研究，从工程化角度验证其可行性。研究团队针对

2025年5月13日8时作者机器之心

蚂蚁和中国人民大学的研究团队提出ViLAMP模型，实现对超长视频的高效处理。ViLAMP通过混合精度策略，在关键帧上保持高精度分析，大幅提升了视频理解效率，并在多个基准测试中超越现有方案。

2025年5月13日8时作者机器之心

智能，也难以媲美人类大脑的表现和效率。
研究者经常从大自然中寻找灵感，了解如何在人工智能领域取得进步

2025年5月12日23时作者极市干货

港中文MMLab提出T2I-R1，结合语义级和细粒度生成推理的图文生成模型，在多种基准测试中均表现最优。

2025年5月12日23时作者极市干货

系统梳理了统一多模态理解和生成模型的最新进展，将其分为基于扩散、自回归及混合三大架构范式，并探讨了该

2025年5月12日16时作者 PaperWeekly

符号逻辑推理的有效性与普遍性，
提升大模型的逻辑推理能力
成为解决幻觉问题的关键途径。
为推进大语言