冲就完事!38万奖金池 + 万元京东卡,金融大模型实战任务等你来解

2025年第五届数创金融杯大模型应用挑战赛由厦门国际银行和厦门大学联合主办,旨在促进金融知识管理与解决方案的落地。大赛自5月9日启动以来备受关注,鼓励各方参与以赢取奖金和京东卡奖励。

「R1时刻」降临!港中文MMLab定义文生图新范式,彻底告别“无脑画图”

最近的大语言模型在数学和编程等领域展示了强大的推理能力,通过强化学习使用思维链逐步分析问题。本文介绍了一种新的方法将这种策略应用于图片生成任务中,提出了两种不同的层次的思维链(CoT):Semantic-CoT负责设计图像的整体结构,而Token-CoT则专注于逐块生成细节。通过使用强化学习优化这两个层次的CoT,并引入多个视觉专家模型作为奖励模型来评估生成的图片质量,最终提出了一种新的文生图模型T2I-R1,显著提高了模型生成符合人类期望的结果的能力。

ICML 2025 图提示到底“灵”在哪?港中文团队用数学告诉你答案!

近年来,图提示作为一种轻量级迁移学习方法逐渐受到关注。该方法通过对输入图结构进行微调,在不修改模型参数的前提下适配新的任务场景,显著简化了模型部署流程。本文介绍了一项研究,提出从数据操作视角理解图提示的理论框架,并系统地分析和证明其有效性。

组会前夜必看:如何用1小时把论文「吃干抹净」?

文章介绍了在科研学习中使用AI辅助的好处,特别是秘塔AI的新功能“今天学点啥”,它能够根据上传或搜索到的资料生成系统化、结构化的讲解,帮助用户理清知识点。它不仅能提供深度模式和不同风格的教学方式,还能通过练习题来检测学习效果。

GUI智能体“大脑”升级!浙大&港理工等提出InfiGUI-R1,用强化学习实现深度推理

文章介绍了InfiGUI-R1,一个基于Actor2Reasoner框架训练的GUI智能体。该模型旨在提升AI在多步骤操作任务中的能力和可靠性,并能像人类一样先思考后行动。通过推理注入和深思熟虑增强两阶段训练方法,30亿参数的InfiGUI-R1-3B模型在多个基准测试中表现出色。

ICLR 2025 告别Token丢弃:更适合CoT和多轮对话的长文本推理加速方法

OmniKV 提出了一种创新性的动态上下文选择方法,用于高效处理长上下文 LLM 推理。它无需丢弃任何 Token,通过动态选择实现计算稀疏,显著提升推理速度和吞吐量,且在各种预算下均优于丢弃 Token 的方法。